修车大队一品楼qm论坛51一品茶楼论坛,栖凤楼品茶全国楼凤app软件 ,栖凤阁全国论坛入口,广州百花丛bhc论坛杭州百花坊妃子阁

oe1(光电查) - 科学论文

20 条数据
?? 中文(中国)
  • [IEEE IGARSS 2018 - 2018年IEEE国际地球科学与遥感研讨会 - 瓦伦西亚(2018.7.22-2018.7.27)] IGARSS 2018 - 2018年IEEE国际地球科学与遥感研讨会 - SAR图像识别中的自适应加权多任务稀疏表示分类

    摘要: 本文提出了一种新颖的单演信号多任务稀疏表示(MSR)方法,以克服单演信号三个分量异质性导致的误分类问题。近年来,由于单演信号具有在最大空间定位条件下捕获宽频谱信息的能力,已被应用于SAR图像识别领域。该信号可分解为不同尺度下的三个分量(局部幅值、局部相位和局部方向)。这些分量被整合为三类特定特征后输入多任务稀疏表示分类框架。然而,三类特定特征的异质性使得通过简单累计多任务稀疏表示分类中的误差难以做出决策。为此,设计了一种基于Fisher判别准则的多任务学习模型,并引入Fisher分数来衡量三类特定特征在不同类别中的区分能力。最终决策通过加权累计重构误差实现。实验结果验证了自适应加权单演信号MSR分类方法的有效性。

    关键词: 多任务稀疏表示、图像识别、合成孔径雷达

    更新于2025-09-23 15:22:29

  • 基于卷积神经网络(CNN)的图像识别技术在环境监测无人机图像定位中的应用研究

    摘要: 无人机遥感已广泛应用于应急救援、灾害救助、环境监测、城市规划等领域。环境监测中的图像识别与图像定位已成为计算机视觉领域的研究热点。卷积神经网络模型是最常用的图像处理模型,相较于传统人工神经网络模型,卷积神经网络具有更多隐藏层,其独特的卷积和池化操作在图像处理中效率更高,在图像识别与定位等二维图形任务中具有无可比拟的优势。作为卷积神经网络的新型变体,残差神经网络旨在让卷积层学习残差而非直接学习目标。通过分析CNN模型的图像特征表征特性及残差网络后,构建了残差网络模型。选取无人机遥感系统作为平台获取图像数据,研究基于残差神经网络的图像识别问题,并通过实验仿真与精度分析进行验证。最后探讨了学习与设计过程中的问题与经验,展望了图像目标定位与识别领域的未来改进方向。

    关键词: 残差网络、卷积神经网络、图像识别、无人机

    更新于2025-09-23 15:22:29

  • 人类对受自然图像流形模型约束的扰动的敏感性

    摘要: 人类对自然图像的统计特性具有高度适应性。然而由于大多数对自然图像的参数化处理都会使其显得不自然,因此量化描述自然图像域内的处理过程一直存在困难。我们利用生成对抗网络(GAN)将参数化处理约束在自然图像流形的近似范围内。在第一项实验中,七名观察者需判断两个合成扰动图像中哪一个与未受扰动的合成对照图像匹配。相较于直接作用于像素空间的扰动,观察者对受限于自然图像近似流形的扰动表现出显著更高的敏感性。逐次试验的错误模式表明,这些扰动会破坏用于图像分割的视觉结构构型特征。第二项实验中,五名观察者对GAN重建的图像流形路径进行判别。观察者在此任务中表现优异,证实了人类确实能感知自然图像近似流形的精细属性。我们得出结论:人类对自然图像的适应性不仅体现为检测非自然外观的偏差,在某种程度上还能把握自然图像间的精细关联关系。

    关键词: 自然图像、图像识别、噪声扰动、人工神经网络、生成对抗网络

    更新于2025-09-23 15:21:01

  • [智能系统与计算进展] 智能计算技术最新研究成果 第709卷(第五届ICACNI 2017会议录,第3卷)|| 基于深度卷积架构的图像识别最优方法

    摘要: 近年来,深度学习因其卓越性能在各类机器学习算法中广受青睐。这种层级化或结构化学习方法通过处理层组来建模数据中的高层抽象特征。其架构基础源于对人类大脑信息处理机制与神经响应的认知,通过堆叠多个线性/非线性运算构建而成。本文重点探讨前沿深度学习模型及多种面向实际应用的专项训练方法。针对特定问题选择最优架构颇具挑战性,在文章结尾部分,我们提出了适用于图像识别任务的最优深度卷积架构方案。

    关键词: 深度神经网络、图像识别、图像处理、迁移学习、卷积神经网络、深度学习

    更新于2025-09-23 15:21:01

  • 基于图像识别的视觉密码加密文本自动解密方法

    摘要: 仅使用密码已迅速成为一种安全风险。另一种安全方案是视觉密码学(VC),它将纸质文档分割成多份加密纸片并由多人分别保管。解密时需将这些纸片叠放组合——单独一张纸片无法完成解密。本研究致力于开发数字设备上解密VC加密文本的系统,并提出通过数码设备摄像头采集图像来自动识别加密区域的方法。本系统具有多重优势:通信过程中不存在实际文本传输,且用户每次使用时可采用不同密码或密保问题。此外,该方法可部署于类眼镜的可穿戴设备,在佩戴者注视加密区域时即可实现文本解密。我们通过识别准确率与性能测试实验验证,结果表明所提方法能以低成本实现高识别率。

    关键词: 数字设备、解密、视觉密码学、图像识别

    更新于2025-09-23 15:19:57

  • [计算机科学讲义] 神经信息处理 第11306卷(第25届国际会议,ICONIP 2018,柬埔寨暹粒,2018年12月13-16日,会议录,第六部分)|| 基于Gabor滤波器和伪逆学习自编码器的快速图像识别

    摘要: 深度神经网络已成功应用于多个领域,并在一些典型任务(尤其是计算机视觉)中取得了显著成果。然而,深度神经网络通常采用基于梯度下降的算法进行训练,这会导致梯度消失和梯度爆炸问题。此外,设计深度神经网络结构并为特定任务寻找最优超参数需要专家级的专业知识,因此训练深度神经网络成为一个非常耗时的过程。为克服上述缺点,我们提出了一种结合Gabor滤波器和伪逆学习自编码器的模型。该模型优化采用非梯度下降算法,同时我们给出了在整个训练过程中设置隐藏神经元数量和隐藏层数量的经验公式。实验结果表明,我们的模型在速度上优于现有基准方法,同时具有相当的识别精度。

    关键词: 伪逆学习自编码器、伽柏滤波器、手工特征、图像识别

    更新于2025-09-23 15:19:57

  • 一种基于新局部知识的图像识别协同表示方法

    摘要: 近年来,基于协作表示的分类器(CRC)在识别任务中展现出卓越性能。大多数CRC算法成功的关键在于:测试样本能通过全局合适的字典得到良好编码,而样本间的局部知识尚未被充分考量。我们观察到相似样本的表示具有高度相似性。为利用这一重要相似信息,本文提出一种新型基于局部知识的图像分类协作表示模型。具体而言,首先需确定测试图像的若干相邻训练样本,继而利用这些邻域样本的表示来引导测试样本系数更具判别性。此外,我们推导出该方法的鲁棒版本以处理存在遮挡或损坏的人脸识别问题。大量实验表明,在各类图像识别任务中,本方法较其他先进分类器具有显著优势。

    关键词: 监督学习、图像识别、鲁棒性、协同表示、局部一致性

    更新于2025-09-23 15:19:57

  • 基于图像识别与图像处理的港区物流运输车辆路径引导研究

    摘要: 由于港区物流货物杂乱,部分自动运输车辆常因路径识别误差较大而在货物运输中出现差错。本研究基于图像识别技术,以港区最常见的物流运输车辆为研究对象,采用视频图像识别技术作为指导技术对地面引导路径进行图像识别处理。同时,本研究确定了更有利于视觉导航的图像预处理方法,利用图像的形态学知识检测路径图像边缘,进而确定路径中心线位置,并进行了仿真分析。研究表明,本研究成果具有一定实用性,可为后续相关研究提供理论参考。

    关键词: 图像识别、物流运输车辆、图像处理、港区

    更新于2025-09-23 13:52:06

  • 基于新进化技术的图像配准方法

    摘要: 本文报道的研究旨在开发用于签名识别的图像配准进化算法。我们提出并开发了多种配准方法以获得精确快速的算法。首先介绍了两种萤火虫算法变体,其展现出优异的精度和适中的运行时间。为加速计算,我们提出了两种加速粒子群优化(APSO)方法的变体。所得算法比基于萤火虫的算法快得多,但识别率略低。为在识别率和算法计算复杂度之间取得平衡,我们开发了一种混合方法,结合了自适应进化策略(ES)搜索发现全局最优解的能力与APSO的快速收敛特性。通过大量不同签名图像对的测试实验证明了所得算法的准确性和效率。论文最后部分提供了关于所提方法质量的对比分析及后续发展的结论与建议。

    关键词: 混合技术、图像识别、图像配准、萤火虫算法、进化计算、仿射扰动、进化策略、互信息

    更新于2025-09-23 16:47:23

  • [IEEE TENCON 2019 - 2019年IEEE第十区会议(TENCON) - 印度科钦(2019.10.17-2019.10.20)] TENCON 2019 - 2019年IEEE第十区会议(TENCON) - 基于LSTM和CNN的语音辅助视觉问答系统(含实时图像采集功能)助力视障人士

    摘要: 该研究工作使视障人士能够独立于外部支持识别物体并可视化周围场景。在此情境下,用户可通过语音输入向应用程序提出开放式问题、分类问题、计数问题或是非问题。该应用采用视觉问答(VQA)技术整合图像处理与自然语言处理功能,同时具备语音转文字及反向转换能力,从而帮助识别、认知并获取特定图像的详细信息。研究采用经典CNN-LSTM模型,分别计算图像特征与语言特征后,通过从问题中提取的图像特征和词嵌入进行特征融合,再对组合特征运行多层感知机以获得结果。该模型准确率达到57%。此模型还可用于提升儿童的认知理解能力。由于应用支持语音交互并配备简易图形界面,特别适合视障人士使用。

    关键词: VGG16、视障人士、Keras神经网络库、ImageNet、gTTS、特征提取、图像识别、VQA、Word2Vec、语音识别、Glove向量、CNN、多层感知机、LSTM

    更新于2025-09-16 10:30:52