- 标题
- 摘要
- 关键词
- 实验方案
- 产品
-
基于类别残差注意力学习的多标签胸部X光图像分类
摘要: 本文研究了胸部X光图像多标签胸腔疾病分类问题。从胸片识别一种或多种病理常受无关病理干扰。为此,我们提出类别残差注意力学习(CRAL)框架:通过类特异性注意力视图预测多病理存在情况,对无关类别特征赋予较小权重以抑制干扰,同时增大相关特征的权重强化其表现。该框架包含特征嵌入??橛胱⒁饬ρ澳?椤罢咄ü砘窬缣崛「卟闾卣?,后者专注于探索不同类别的权重分配方案,且能灵活集成至任意特征嵌入网络进行端到端训练。在Chest X-ray14数据集上的综合实验表明,CRAL取得0.816的平均AUC分数,刷新了当前最优性能。
关键词: 图像分类,胸部X光片,卷积神经网络,残差注意力机制
更新于2025-09-23 15:23:52
-
[IEEE 2018第三届机械、控制与计算机工程国际会议(ICMCCE) - 呼和浩特(2018.9.14-2018.9.16)] 2018第三届机械、控制与计算机工程国际会议(ICMCCE) - 基于Faster R-CNN的遥感图像关键目标识别系统设计
摘要: 针对遥感图像中关键目标传统低层识别问题,提出一种基于Faster R-CNN的目标检测与识别方法。首先将开源遥感图像数据集NWPU VHR-10数据集转换为VOC 2007格式作为训练集和测试集;其次根据训练集类别信息优化神经网络超参数,采用Faster R-CNN神经网络对训练集进行训练生成模型;最后利用该模型对未知遥感图像进行检测并识别重要目标。仿真结果表明,该方法具有较高的识别精度和速度,可为遥感图像关键目标识别提供参考。
关键词: Faster R-CNN、卷积神经网络、深度学习、关键目标识别、遥感图像检测
更新于2025-09-23 15:22:29
-
[IEEE 2018年第二届数据科学与商业分析国际会议(ICDSBA)- 中国长沙(2018.9.21-2018.9.23)] 2018年第二届数据科学与商业分析国际会议(ICDSBA)- 基于全卷积神经网络的糖尿病视网膜病变图像检测
摘要: 本文探讨了在数据科学与商业分析背景下,卷积神经网络(CNN)模型在数字图像处理中的开发与应用,重点在于提高图像分类任务的准确性与效率。
关键词: 图像分类、数字图像处理、商业分析、数据科学、卷积神经网络
更新于2025-09-23 15:22:29
-
[IEEE 2018年国际成像系统与技术会议(IST)- 克拉科夫(2018.10.16-2018.10.18)] 2018年IEEE国际成像系统与技术会议(IST)——基于监控摄像头的货架商品数量稳健估计以提升上架可得性
摘要: 本文提出一种通过监控摄像头稳健估计货架商品数量的方法,以提升上架可用率。我们重点关注货架商品的变动情况(如"商品被取走(减少)"和"商品补货/归还(增加)"),并通过精确累计这些变动来计算商品数量。该方法首先利用背景减除结合运动目标去除技术检测图像中货架商品的变动区域,随后通过卷积神经网络将这些检测到的变动区域分类为表征实际货架变动的类别(如"商品被取走")。最终基于分类结果累计货架商品变动量,并将图像可见货架区域的商品数量作为上架可用率进行计算。使用真实商店拍摄的两段视频进行的实验表明:当误差范围在1件商品以内时,本方法的上架可用率识别成功率达到89.6%。凭借高精度特性,店员可维持较高的上架可用率,从而提升零售商店的经营利润。
关键词: 产品数量、图像处理、上架可用性、卷积神经网络、监控摄像头、零售业、背景减除
更新于2025-09-23 15:22:29
-
遥感图像目标检测中的尺度自适应提议网络
摘要: 航拍图像中的目标检测在许多应用中具有广泛用途。近年来,快速区域卷积神经网络在自然图像目标检测方面展现出显著改进。考虑到遥感图像中目标的尺寸和分布特征,在采用该技术前需对区域提议网络(RPN)进行改进。本文提出一种尺度自适应提议网络(SAPNet)以提高遥感图像多目标检测的精度。该网络由设计用于生成多尺度目标提议的多层RPN构成,并包含采用融合特征层以优化多目标检测的最终检测子网络。对比实验结果表明,所提出的SAPNet显著提升了多目标检测的准确性。
关键词: 区域提议网络(RPN)、多目标检测、遥感图像、卷积神经网络(CNN)
更新于2025-09-23 15:22:29
-
用于多焦点图像融合的多层次特征卷积神经网络
摘要: 多聚焦图像融合是一种通过融合多幅输入图像生成单一清晰图像的重要技术。本文提出了一种新型多层级特征卷积神经网络(MLFCNN)架构用于图像融合。在MLFCNN模型中,从先前层学习到的所有特征都会传递至后续层。在每一条连接前一层与后一层的路径中,我们添加1×1卷积??橐越档腿哂喽?。本方法首先将源图像输入预训练的MLFCNN模型获取初始聚焦图,随后对初始聚焦图进行形态学开闭运算并施加高斯滤波得到最终决策图,最后基于加权求和策略结合决策图生成全聚焦融合图像。实验结果表明,该方法在定性与客观评价方面均优于部分现有先进图像融合算法。
关键词: 卷积神经网络、决策图、多聚焦图像融合、多层次特征
更新于2025-09-23 15:22:29
-
一种用于无参考图像质量评估的新型基于补丁方差偏置的卷积神经网络
摘要: 深度卷积神经网络(CNN)已成功应用于符合人类感知的无参考图像质量评估(NR-IQA)。现有方法大多处理小尺寸图像块,并通过测试块的平均得分预测整图质量。我们发现,来自均匀区域的图像块对神经网络训练和最终质量评分估计均不可靠。此外,具有复杂结构的图像块更有可能实现更优的图像质量预测?;谡庑┓⑾?,我们改进了传统基于CNN的NR-IQA算法,避免使用均匀块进行网络训练和质量评分估计。同时采用基于方差的加权平均法,使最终质量评分向复杂结构图像块倾斜。实验结果表明,相比知名NR-IQA算法,这种简单方法能达到最先进的性能水平。
关键词: 深度学习,无参考图像质量评估,卷积神经网络
更新于2025-09-23 15:22:29
-
[IEEE 2018年第十届无线通信与信号处理国际会议(WCSP)- 杭州(2018.10.18-2018.10.20)] 2018年第十届无线通信与信号处理国际会议(WCSP)- 基于FMCW雷达传感器的动态手势识别用于驾驶辅助
摘要: 动态手势识别对于人机交互至关重要。在车辆中,手势识别可作为驾驶员辅助系统实现仪表远程控制,在一定程度上能避免物理按键和触摸屏对驾驶员造成干扰。本文描述了一种基于77GHz调频连续波雷达获取的微多普勒特征,利用卷积神经网络(CNN)对九种手势进行分类的驾驶员辅助动态手势识别系统。我们进一步探究了相同手势在不同实验场景中的准确率变化,以帮助优化系统的鲁棒性。
关键词: 卷积神经网络、手势识别、驾驶员辅助系统、调频连续波雷达传感器
更新于2025-09-23 15:22:29
-
[IEEE 2018年第25届国际图像处理会议(ICIP) - 希腊雅典(2018.10.7-2018.10.10)] 2018年第25届IEEE国际图像处理会议(ICIP) - 多层次卷积特征融合的相关滤波跟踪方法
摘要: 判别式相关滤波器(DCFs)在视觉跟踪领域日益受到关注。近期部分研究将DCF视为特殊网络层并嵌入到孪生网络中实现视觉跟踪。然而这些方法采用浅层网络学习目标表征,缺乏深层网络中的鲁棒语义信息,导致其难以应对显著的外观变化。本文设计了一种融合多层级卷积特征的新型网络,各层级从不同视角刻画目标特征。我们将该网络与DCF层集成,构建了端到端的深度视觉跟踪架构。整个网络通过离线端到端训练自适应地学习目标表征,不仅能编码高层语义特征和低层空间细节特征,还与相关滤波器紧密关联。实验表明,所提跟踪器性能优于当前最先进的跟踪方法。
关键词: 相关滤波器、视觉跟踪、卷积神经网络
更新于2025-09-23 15:22:29
-
[IEEE 2018年国际智能交通系统会议(ITSC) - 美国夏威夷州毛伊岛(2018.11.4-2018.11.7)] 2018年第21届国际智能交通系统会议(ITSC) - 基于3D激光雷达点云与图像语义分割的车辆检测与定位
摘要: 本文提出了一种实时检测与定位城市驾驶场景中周边车辆的方法。我们设计了一个多模态融合框架,通过处理三维激光雷达点云和RGB图像来获取鸟瞰图视角下稳健的车辆位置与尺寸信息。其中RGB图像的语义分割采用我们高效设计的卷积神经网络架构ERFNet实现。该方法充分利用了激光雷达提供的精确深度信息和摄像头处理的丰富语义信息。实验基于KITTI目标检测基准数据集进行测试,结果表明我们的方法优于或持平于其他先进方案——尽管CNN模型是在其他数据集训练的,但仍展现出良好的跨域泛化能力,这对自动驾驶具有关键意义。
关键词: 本地化、ERFNet、图像语义分割、KITTI、自动驾驶、车辆检测、卷积神经网络、点云、多模态融合、3D激光雷达
更新于2025-09-23 15:22:29