研究目的
实施并评估Faster R-CNN模型用于内镜视频中的息肉检测,以促进早期诊断并减少临床实践中的漏诊。
研究成果
Faster R-CNN在内镜视频中对息肉的检测表现出高性能,在精度等指标上与最先进方法相比取得了具有竞争力的结果。该方法对遮挡和光照变化具有鲁棒性,但在处理小息肉和误报方面存在局限。该方案在临床应用中效率较高,有减少漏检的潜力,不过仍需进一步研究以解决定位误差问题。
研究不足
该探测器可能会漏检非常小的息肉,并将镜面高光或其他噪声误认为息肉,从而导致定位时的假阳性率较高。与微调相比,使用随机初始化从头开始训练的效果较差,且由于无法获取ASU梅奥诊所等私有数据集,研究未对其进行验证,这可能限制了模型的泛化能力。
1:实验设计与方法选择:
本研究采用以VGG16为骨干网络的特征提取框架Faster R-CNN,因其具备深度特征提取能力且兼顾复杂度与运行效率的平衡。研究方法包括在结肠镜视频数据集上进行训练和测试,以实现息肉检测与定位。
2:样本选择与数据来源:
使用公开数据集,包括CVC-Clinic2015(612?。?、CVC-Clinic2017(训练11954帧/测试18733?。?、CVC-ColonDB(300?。┖虲VC-EndoSceneStill(912?。?。图像统一缩放至384×288像素,仅进行水平翻转等基础变换,未采用数据增强技术。
3:实验设备与材料清单:
使用K40c GPU完成Faster R-CNN模型的训练与测试。软件实现包含Faster R-CNN和VGG16架构,模型权重初始化自ImageNet预训练参数。
4:实验流程与操作规范:
Faster R-CNN架构通过区域提议网络(RPN)和头部网络生成候选框并进行分类。训练采用近似联合优化(AJO)方法,小批量尺寸128,使用SGD优化器,经70000次迭代后收敛。测试阶段每帧生成1-300个候选框,通过非极大值抑制和置信度阈值设置进行评估。
5:数据分析方法:
性能指标包含真阳性(TP)、假阳性(FP)、真阴性(TN)、假阴性(FN)、精确率、召回率、准确率、F1分数、F2分数、反应时间(RT)及定位平均距离(MD)。最终结果通过这些指标与现有最优方法进行对比。
独家科研数据包,助您复现前沿成果,加速创新突破
获取完整内容