修车大队一品楼qm论坛51一品茶楼论坛,栖凤楼品茶全国楼凤app软件 ,栖凤阁全国论坛入口,广州百花丛bhc论坛杭州百花坊妃子阁

oe1(光电查) - 科学论文

22 条数据
?? 中文(中国)
  • 一种自上而下的大尺度遥感图像语义分割方法

    摘要: 遥感数据量的不断增加为具有挑战性的新研究课题打开了大门。如今,针对海量数据,人们投入了大量精力进行基于像素和对象的分类研究。本文探讨了大规模遥感图像的语义分割问题。为此,我们提出了一种基于两个主要步骤的自上而下的方法。第一步旨在计算对象级特征,这些特征构成多层前馈网络的输入,用于生成遥感对象分类结构。第二步的目标是利用该结构对新图像中的每个像素进行标记?;谡媸凳菁辛硕嘞钍笛?,结果表明所提方法具有良好的分类精度。此外,与现有分类技术的对比证明,该方法尤其适用于大规模遥感数据,具有显著有效性。

    关键词: 神经网络、遥感影像、大数据、语义分割

    更新于2025-09-23 15:23:52

  • FRED-Net:用于精确虹膜分割的全残差编解码网络

    摘要: 虹膜识别技术目前已发展到可在远距离识别人物的水平。其中,虹膜分割过程通过控制当前阶段的误差,在维持基于虹膜识别系统的准确性方面起着至关重要的作用。然而,其性能会受到环境光噪声和用户不配合等非理想情况的影响。现有的基于局部特征的分割方法在这些非理想情况下无法找到真实的虹膜边界,且分割阶段产生的误差会传递至后续所有阶段,导致准确性和可靠性下降。此外,还需要在不增加去噪等预处理额外成本的情况下实现真实虹膜边界的分割。 为克服虹膜分割过程中的这些挑战性问题,本研究提出了一种基于深度学习的全残差编码器-解码器网络(FRED-Net),通过残差跳跃连接使高频信息从前层流向后层,从而确定真实的虹膜区域。本研究的四大影响与意义如下:首先,FRED-Net是一个端到端的语义分割网络,不采用传统图像处理方案,且无预处理开销。该独立网络无需进行眼睑、睫毛和反光点检测即可获取真实虹膜边界。其次,所提出的FRED-Net是逐步开发的最终成果结构,每一步都根据网络的详细描述创建了用于语义分割的新完整变体网络。第三,FRED-Net通过编码器和解码器的残差快捷连接利用卷积层间的残差连通性,使高频分量能在网络中流动,从而以较少层数实现更高精度。第四,通过在可见光和近红外光环境下使用五个不同虹膜数据集,以及两个通用道路场景分割数据集对FRED-Net的性能进行测试。为与其他研究进行公平比较,我们训练的FRED-Net模型及算法已通过网站公开(东国大学FRED-Net模型与算法,访问日期:2018年5月16日)。 实验包含两组数据集:从UBIRIS.v2数据库选取的可见光环境下的"噪声虹膜挑战评估第二部分(NICE-II)"和"移动虹膜挑战评估(MICHE-I)";以及近红外(NIR)光环境下的三个数据集——中国科学院自动化研究所(CASIA)v4.0间隔版、v4.0远距离版和德里印度理工学院(IIT Delhi)v1.0版。此外,为评估该网络在通用分割中的性能,还包含对两个著名道路场景分割数据集——剑桥驾驶标注视频数据库(CamVid)和卡尔斯鲁厄理工学院与芝加哥丰田技术研究所(KITTI)的实验。实验结果表明,所提出的FRED-Net在上述七个虹膜及通用道路场景分割数据集上均展现出最优性能。

    关键词: 虹膜分割、全残差编码器-解码器网络、虹膜识别、语义分割

    更新于2025-09-23 15:23:52

  • SCN:用于RGB-D图像语义分割的可切换上下文网络

    摘要: 上下文表征已广泛应用于提升语义图像分割效果。深度数据的出现为构建更具判别力的上下文表征提供了额外信息。深度数据能保留场景中物体的几何关系,而这种关系通常难以从RGB图像中推断。尽管深度卷积神经网络(CNN)在解决语义分割问题上已取得成功,但我们面临如何利用深度数据中有价值的上下文信息来优化CNN训练以提升分割精度的问题。本文提出一种新型可切换上下文网络(SCN)来实现RGB-D图像的语义分割。深度数据用于识别存在于多个图像区域中的物体,该网络通过分析各图像区域信息来识别不同特征,再通过切换网络分支进行选择性利用。基于从图像固有结构中提取的内容,我们能够生成同时感知图像结构和物体关系的有效上下文表征,从而实现语义分割网络更连贯的学习。实验证明,我们的SCN在两个公开数据集上均优于现有最优方法。

    关键词: 上下文表示、卷积神经网络(CNN)、RGB-D图像、语义分割

    更新于2025-09-23 15:23:52

  • [IEEE 2018年第25届国际图像处理会议(ICIP) - 希腊雅典 (2018.10.7-2018.10.10)] 2018年第25届IEEE国际图像处理会议(ICIP) - 基于域相似性判别器的对抗性域适应方法在城市区域语义分割中的应用

    摘要: 现有的城市区域语义分割模型在监督学习环境下表现良好。然而,为训练此类模型从每个城市收集大量标注图像既耗时又困难。此外,当将分割模型从训练城市(源域)迁移到未见过城市(目标域)时,由于领域偏移,性能会大幅下降。为此,我们提出一种带有领域相似性判别器的领域自适应方法,在对抗学习框架中消除这种领域偏移。与单输入对抗网络不同,我们的领域相似性判别器由孪生网络构成,能够测量成对输入数据的相似性。通过这种方式,我们可以利用更多关于成对输入的信息来衡量不同分布之间的相似性,从而解决领域偏移问题。实验结果表明,我们的方法在三个不同城市上优于对比方法。

    关键词: 领域自适应、城市区域、语义分割、领域偏移、孪生网络

    更新于2025-09-23 15:22:29

  • [IEEE 2018年第25届国际图像处理大会(ICIP) - 希腊雅典 (2018.10.7-2018.10.10)] 2018年第25届IEEE国际图像处理大会(ICIP) - 用于语义分割的密集反卷积网络

    摘要: 最近,探索全卷积网络(FCN)中不同层的多特征图以获取语义分割的上下文信息受到了广泛关注。本文提出了一种用于语义分割的新型编码器-解码器架构——密集反卷积网络(DDN),该架构通过深层卷积层的特征图对浅层反卷积层进行密集上采样。所提出的DDN支持端到端训练,使我们能够充分挖掘图像中嵌入的多尺度上下文线索。实验结果表明,在PASCAL VOC 2012数据集上,我们的DDN性能优于以往的FCN和编码器-解码器网络(EDN)。

    关键词: 全卷积网络(FCNs)、编码器-解码器网络(EDNs)、语义分割、密集反卷积网络

    更新于2025-09-23 15:22:29

  • [ACM出版社 第二届国际会议 - 中国成都 (2018年6月16日-2018年6月18日)] 第二届图像处理进展国际会议论文集 - ICAIP '18 - MIFNet

    摘要: 海陆分割对于海岸线提取和船舶检测具有重要意义。由于高分辨率遥感图像具有复杂的纹理和强度分布特征,基于阈值和人工特征的传统方法难以取得良好效果。本文提出了一种基于卷积神经网络的新型多信息融合网络(MIFNet)。该网络不仅考虑了多尺度边缘和多尺度分割信息,还引入了全局上下文信息,并通过网络学习融合不同尺度和类型的信息。在谷歌地球自然色图像集上的实验表明,我们的模型性能优于现有最先进方法。

    关键词: 语义分割、海陆分割、全局上下文、多信息

    更新于2025-09-23 15:22:29

  • [IEEE IGARSS 2018 - 2018年IEEE国际地球科学与遥感研讨会 - 瓦伦西亚(2018.7.22-2018.7.27)] IGARSS 2018 - 2018年IEEE国际地球科学与遥感研讨会 - 基于多模态数据的高分辨率航空影像深度语义分割

    摘要: 本文重点研究利用多模态数据实现航拍图像的语义分割。该多模态数据由真正射影像、数字表面模型(DSM)及由此衍生的其他表征组成。我们将不同模态的数据分别及组合输入残差混洗卷积神经网络(RSCNN),通过基准数据集分析其对分类任务的价值。结果表明,在真正射影像基础上引入从DSM提取的不同类型几何特征可提升分割效果。

    关键词: 多模态数据、航空影像、Shuffling-CNN、深度学习、语义分割

    更新于2025-09-23 15:22:29

  • 基于密集金字塔网络的高分辨率航空影像语义标注

    摘要: 高分辨率航空影像的语义分割在某些领域具有重要意义,但空间分辨率的提高会带来较大的类内方差和较小的类间差异,从而导致分类模糊性?;诟卟闵舷挛奶卣鳎疃染砘窬纾―CNN)是处理高分辨率航空影像语义分割的有效方法。本研究提出了一种用于语义分割的新型密集金字塔网络(DPN)。该网络首先采用分组卷积以通道方式处理多传感器数据,分别提取每个通道的特征图,从而保留更多通道信息;随后通过通道混洗操作增强网络的表征能力。接着利用四个密集连接的卷积块来提取并充分利用特征。结合两个卷积层的金字塔池化??橥ü行У娜殖【跋妊榉绞饺诤隙喾直媛视攵啻衅魈卣鳎筛骼啾鸬母怕释?。此外,为解决类别不平衡问题,训练阶段采用中值频率平衡焦点损失替代标准交叉熵损失。我们在国际摄影测量与遥感学会(ISPRS)Vaihingen和Potsdam二维语义标注数据集上评估了该密集金字塔网络,结果表明所提框架相比现有最优基线具有更优性能。

    关键词: 金字塔池化???、语义分割、密集连接卷积、高分辨率航空影像

    更新于2025-09-23 15:21:21

  • [计算机科学讲义] 模式识别与计算机视觉 第11256卷(首届中国会议,PRCV 2018,中国广州,2018年11月23-26日,会议录,第一部分)|| 基于空三影像语义约束的大规模运动恢复结构

    摘要: 运动恢复结构(SfM)与语义分割是计算机视觉的两个分支。然而此前鲜有方法将二者结合。传统特征检测方法的精度限制了SfM在复杂场景中的应用。随着语义分割研究领域的蓬勃发展,我们能以较小代价获取各特定任务中高置信度的语义信息。本文利用语义分割信息提出提升特征点匹配精度的新方法,并基于语义分割结果中的语义约束,提出带等式约束的新型光束法平差技术。通过挖掘等式约束的稀疏性,证明该约束光束法平差可通过序列二次规划(SQP)高效求解。该方法达到了最先进的精度水平,且通过按语义标签对描述符分组,略微提升了候选匹配速度。此外,本方法展现出语义分割自动标注的潜力。总之,本研究有力验证了SfM与语义分割的相互促进作用。

    关键词: 序列二次规划,等式束调整,语义分割,运动恢复结构

    更新于2025-09-23 15:21:01

  • PhaseNet:一种用于二维相位解缠的深度卷积神经网络

    摘要: 相位解缠是多个应用领域中一项关键的信号处理问题,其目标是从包裹相位中恢复原始相位。本文提出一种名为PhaseNet的新型深度全卷积神经网络相位解缠框架。我们将直接获取连续原始相位的定义重构为通过语义分割获取每个像素的缠绕数(2π整数跳变),并通过合适的深度学习框架实现。该架构包含编码器网络、对应的解码器网络及像素级分类层。利用绝对相位与缠绕数之间的关系,我们生成了多种随机形状的丰富模拟数据,使网络专注于学习包裹相位图中的连续性而非训练数据的特定模式。通过与广泛采用的质量引导相位解缠算法及不同噪声水平下的MATLAB unwrap函数对比,发现本框架具有抗噪性强和计算快速的特点。结果表明深度卷积神经网络(DCNN)确实能有效应用于相位解缠,本框架有望为开发新型基于深度学习的相位解缠方法奠定基础。

    关键词: 编码器、解码器、相位解缠、深度卷积神经网络、语义分割

    更新于2025-09-23 15:21:01