- 标题
- 摘要
- 关键词
- 实验方案
- 产品
-
通过卷积神经网络和红外成像技术实现高效面部表情识别
摘要: 面部表情识别是人机交互领域的重要研究课题。红外成像技术在面部表情识别和计算机视觉应用中展现出良好潜力,但低分辨率光谱数据(如波段重叠和随机噪声等问题)限制了其应用。为解决这些问题,本文提出一种基于离散束波变换正则化的快速盲复原模型来重建红外光谱。通过应用离散束波变换分析观测红外光谱与真实光谱在频域的系数分布差异,比较两者的稀疏性。我们提出采用L0范数稀疏系数正则化的红外光谱解卷积模型。在模拟和实际红外光谱数据上执行所提算法,结果表明该方法能有效抑制泊松噪声并保留红外光谱结构。高分辨率红外光谱可提高面部表情分类任务的识别率。
关键词: 正则化、面部表情识别、红外光谱、卷积神经网络
更新于2025-09-16 10:30:52
-
激光制造质量监测的卷积方法
摘要: 从激光加工过程监测中提取有意义的特征,是实现制造件新型无损质量检测方法的基础,这一领域始终保持着日益增长的工业关注度。我们提出ConvLBM——一种实时监测激光制造过程的新方法。该技术通过卷积神经网络模型,从中波红外同轴原始图像中提取特征与质量指标。我们展示了ConvLBM在两种场景下的能力:激光金属沉积中的稀释率估算,以及激光焊接过程中的缺陷定位,其能有效表征工艺动态并预测质量指标。研究成果标志着大尺寸金属件3D打印与焊接过程质量控制领域的突破性进展。同时我们发布了首个带标注的激光制造图像大型数据集。
关键词: 质量控制、激光熔覆、激光焊接、卷积神经网络、神经网络
更新于2025-09-16 10:30:52
-
基于激光扫描三维轮廓数据的道路标线自动检测与测量
摘要: 自动道路标线检测与测量对路面养护管理具有重要意义。激光扫描三维轮廓数据为道路标线检测提供了高程精度约0.25毫米的新方法。本文提出一种基于激光扫描三维路面数据的自动标线检测测量方法,通过三维数据充分分析了表征道路标线的高程特征与几何统计量。首先采用特制阶梯形算子对剖面数据进行卷积运算,在剖面层级识别疑似标线边缘区域,有效降低横向坡度、裂缝及车辙等其他路面因素的影响;其次结合标线区域的几何特征与图像层级的卷积特征连续性,提取疑似三维道路标线区域;随后引入卷积神经网络进行真实标线数据的清晰辨识;最后从检测区域获取三维测量信息及高程数据?;谑挡馊菘沟缆繁晗呤侗鹗笛椋攵晕甯雎范?178个不同类型标线测试样本,检测准确率均达90.8%以上。选取两个路段的多组测量结果显示,标线高程重复测量结果吻合度约95%,200个测量点获取的标线高程与人工测量值相关性达85.36%。
关键词: 道路标线检测、激光扫描、卷积、三维测量信息、卷积神经网络
更新于2025-09-16 10:30:52
-
热轧卷标识印刷质量控制中的工业光学字符识别系统
摘要: 本工作提出了一套用于检测钢卷印刷错误及误识别的系统,这些问题可能导致追踪故障甚至将错误产品交付给终端客户。该系统采用光学字符识别技术,通过工业环境中固定摄像头采集的图像提取钢卷印刷标识。该方法综合运用多种数字图像处理技术应对显著的光照和印刷差异,随后通过分割流程提取并校正原本呈弧形排列的字符,最终基于卷积神经网络进行分类识别。本系统提出了一种处理图像光照变化的方案,可应对低对比度、过暗及过亮等图像情况。在约20,000张图像的数据集上进行的实验取得了超过98%的准确率,验证了所提方法的有效性。
关键词: 数字图像处理,卷积神经网络,光学字符识别,智能制造
更新于2025-09-12 10:27:22
-
二维图像到三维模型:基于知识的单张航拍图像与卷积神经网络三维建筑重建(3DBR)
摘要: 本研究提出一种基于深度学习(DL)的单幅航拍图像建筑物检测与重建方法。通过优化的多尺度卷积-反卷积网络(MSCDN)从RGB图像中获取重建建筑物三维形态所需的先验知识,包括高度数据及各屋顶的线性要素。该网络包含两个特征提取层级,先预测粗粒度特征后自动优化细化,预测特征包含归一化数字表面模型(nDSM)及屋檐线、屋脊线、斜脊线三类屋顶线性要素?;谖蓍芟叻治錾山ㄖ锢庵P停⒗迷げ獾奈菁瓜哂胄奔瓜咧亟ǖザ拔荻ゲ问P?。实验表明,即便存在高度值噪声干扰,该方法对不同形态与复杂度的建筑物三维重建效果良好——预测nDSM的平均均方根误差(RMSE)约3.43米,归一化中值绝对偏差(NMAD)约1.13米;在波茨坦与泽布吕赫测试数据中,提取线性要素的质量分别达91.31%和83.69%。相较于现有先进方法,本方案无需任何辅助数据,仅凭单幅图像即可实现建筑物三维建模,在波茨坦数据上水平与垂直方向RMSE精度分别达1.2米和0.8米,泽布吕赫测试数据上分别为3.9米和2.4米。
关键词: 卷积神经网络、深度学习、建筑物重建、建筑物检测、深度预测
更新于2025-09-12 10:27:22
-
基于卷积神经网络的激光熔覆系统焊道几何参数估计方法
摘要: 激光熔覆是一种复杂的制造工艺。当激光束熔化原料粉末时,激光功率或扫描速度的微小变化都会导致熔覆层几何形状出现偏差。因此,精细调节这些工艺参数对获得理想结果至关重要。为监测并深入理解激光熔覆过程,本文提出了一种熔覆道最终几何形状的自动估算方法。为此,我们开发了六种不同的卷积神经网络架构,用于分析50帧/秒同轴相机采集的熔池图像。这些网络以相机图像和工艺参数作为输入,输出熔覆道的宽度和高度。网络性能测试结果显示:对于高度约1毫米的熔覆道,测试误差均值低至8微米;在宽度维度上,95%的案例误差保持在熔覆道宽度的15%以内。目标值与预测值的对比图显示,测试集的决定系数超过0.95。随后我们对各网络架构进行比较并讨论其性能表现:更深层的卷积层性能显著优于浅层结构,但更深层的密集连接层相比浅层结构反而降低了网络性能。这些成果为智能过程监测提供了新方案,具备实时应用潜力,推动该工艺闭环控制研究向前迈进了一步。
关键词: 光学监测,几何估计,激光熔覆,卷积神经网络,焊道几何形状
更新于2025-09-12 10:27:22
-
[IEEE 2019年第十届高光谱成像与信号处理研讨会:遥感技术演进(WHISPERS)- 荷兰阿姆斯特丹(2019.9.24-2019.9.26)] 2019年第十届高光谱成像与信号处理研讨会:遥感技术演进(WHISPERS)- 基于卷积神经网络的多分辨率草坪杂草分类知识迁移
摘要: 杂草识别与分类是实施定点除草的关键且具有挑战性的任务。由于杂草与作物的光谱相似性较高,本研究采用基于空间信息的对象图像分析方法进行杂草分类。随着多种传感器的广泛应用,我们能够从不同高度、利用不同规格的传感器获取杂草影像。本文提出一种创新方法:通过卷积神经网络(CNN)运用迁移学习技术处理多源传感器获取的多分辨率图像。先利用典型图像数据集训练CNN并迁移其训练权重至不同分辨率的其他数据集,从而仅需少量训练样本对网络进行微调即可实现新数据集分类,大幅降低模型训练所需的大数据量。为避免微调过程中的过拟合问题,我们基于预训练模型初始层参数,研究并提出了小型深度学习架构。实验还探究了训练样本规模对微调效果的影响。田间试验表明,该方法在识别精度和计算成本方面均优于直接训练法。
关键词: 高光谱图像,分辨率,卷积神经网络(CNN),杂草制图,迁移学习
更新于2025-09-12 10:27:22
-
[IEEE 2019年第21届国际多媒体信号处理研讨会(MMSP) - 马来西亚吉隆坡 (2019.9.27-2019.9.29)] 2019 IEEE第21届国际多媒体信号处理研讨会(MMSP) - 基于多视角与先验知识融合的3D面部表情识别
摘要: 本文提出了一种用于三维面部表情识别(FER)的新型多视角卷积神经网络(CNN)模型。与现有主要从正面面部属性图像学习表情的深度学习三维FER方法不同,该模型将观测三维脸部的多视角信息和面部先验知识融入学习过程。这些信息通过端到端方式联合训练,以预测输入三维面部模型的情绪。在公开三维面部表情数据集上的实验表明,相较于单一视角,利用来自不同视角的附加信息和面部先验知识训练CNN能够学习更具判别性的特征。我们的模型在识别准确率方面优于现有最先进的三维FER方法,证明了其有效性。此外,该模型在低强度面部表情区分上的改进效果更为显著。
关键词: 面部表情识别(FER)、卷积神经网络、3D人脸扫描
更新于2025-09-12 10:27:22
-
[2019年IEEE国际图像处理会议(ICIP) - 中国台北 (2019.9.22-2019.9.25)] 2019年IEEE国际图像处理会议(ICIP) - 基于先验知识的高分辨率图像小目标检测
摘要: 当应用常见目标检测算法对高分辨率图像中的小目标进行检测时,由于GPU内存限制,输入图像的下采样操作不可避免,从而导致表征小目标的细节信息丢失。为解决这一矛盾,本文提出了一种粗到精的小目标检测方法。具体而言,首先从低分辨率图像中计算出一些粗略的感兴趣区域(ROI),并利用目标位置的先验知识指导ROI的生成;随后从高分辨率图像中重新计算小ROI的特征,大ROI的特征则从生成ROI所用的特征图中获取。该方法在两个数据集上进行了验证,一个是植物表型数据集,另一个是公开的道路标志数据集。实验结果有力证明了所提方法的有效性。
关键词: 先验知识、卷积神经网络、高分辨率图像、小目标检测
更新于2025-09-11 14:15:04
-
[IEEE 2019年第二届人工智能与大数据国际会议(ICAIBD)- 中国成都(2019.5.25-2019.5.28)] 2019年第二届人工智能与大数据国际会议(ICAIBD)- 基于深度卷积网络的短期光伏发电预测
摘要: 天气条件等不确定因素使得光伏发电预测具有挑战性。因此,一些先进的深度学习(DL)技术已被引入该领域。然而,现有基于DL的模型对历史数据的利用通常仅限于一维功率数组,且描述功率随时间变化的信息也被忽略。不同的是,本研究提出了一种基于深度卷积网络(DCN)的模型,该模型通过结合特征学习和多维数组来尝试提高预测性能。为了匹配DCN范式并深入挖掘功率信息,我们使用历史日数据构建功率张量。我们使用来自真实世界的数据集对所提出的模型进行训练和测试,自我评估以及与几种最先进模型的比较证明了我们提案的优越性。
关键词: 卷积神经网络、功率张量、光伏功率预测、深度学习
更新于2025-09-11 14:15:04