研究目的
利用残差混洗卷积神经网络(RSCNN)分析不同模态(光谱与形状信息)对航拍影像语义分割的价值。
研究成果
结果表明,真实正射影像比单独使用数字表面模型(DSM)或几何特征更适合分类。结合辐射和几何信息能提高分类精度,其中使用红外(IR)、红(R)、绿(G)、归一化数字表面模型(nDSM)、归一化植被指数(NDVI)、亮度(L)、位置(P)和形状(S)图层时效果最佳。额外考虑几何特征(线性、平面性、球形度)可带来改进,而归一化植被指数(NDVI)等植被指数并未提升结果。
研究不足
该研究仅限于Vaihingen数据集,可能无法推广到其他区域或数据类型。训练与测试数据的分割方式与标准ISPRS基准不同,可能影响可比性。使用单GPU和特定图像块尺寸带来的计算限制可能会制约可扩展性。
1:实验设计与方法选择:
该方法采用多模态数据(真实正射影像、数字表面模型及衍生特征)作为输入,通过残差混洗卷积神经网络(RSCNN)进行语义分割。该网络结合了带空洞卷积的ResNet与混洗算子以实现密集预测。
2:样本选择与数据来源:
使用包含33个图块的Vaihingen数据集,涵盖真实正射影像(红外、红、绿波段)、数字表面模型及六类语义标注参考数据。训练选用图块1、3、5、7、13、17、21、23、26、32、37;评估选用图块11、15、28、30、34。
3:37;评估选用图块34。
实验设备与材料清单:
3. 实验设备与材料清单:配备12GB显存的NVIDIA TITAN X显卡,采用MXNet库实现。
4:实验流程与操作步骤:
从输入层提取特征(归一化数字表面模型、归一化植被指数、线性度L、平面度P、球状度S)。使用带动量的随机梯度下降法训练RSCNN,针对不同训练周期采用56×56至448×448像素不等尺寸的图块,对九层数据的不同子集进行分类。
5:数据分析方法:
通过总体精度(OA)、平均F1分数(mF1)、平均交并比(mIoU)及各类别F1分数评估性能。
独家科研数据包,助您复现前沿成果,加速创新突破
获取完整内容