研究目的
通过构建混淆视觉树(CVT)并提出视觉树卷积神经网络(VT-CNN),提高图像数据集中易混淆类别的分类准确率。
研究成果
结合视觉树结构与原始卷积神经网络模型的VT-CNN模型,在图像分类任务中展现出更优性能,尤其对易混淆类别效果显著。实验验证了该模型相较于原始CNN模型的优势,在CIFAR-10和CIFAR-100数据集上实现了准确率的显著提升。
研究不足
该研究专注于提高混淆类别的分类准确性,但未解决因额外树结构导致的计算复杂度可能增加的问题。VT-CNN模型的性能关键取决于CVT构建的准确性。
1:实验设计与方法选择:
本研究基于混淆语义层级信息构建概念混淆树(CVT)以识别混淆类别,并将该树结构嵌入原始CNN模型形成VT-CNN。
2:样本选择与数据来源:
实验在CIFAR-10和CIFAR-100数据集上进行。
3:实验设备与材料清单:
使用配备Intel Core i7处理器、32GB内存及NVIDIA GeForce GTX 1080 Ti显卡的PC机。
4:实验流程与操作步骤:
包括构建CVT、在数据集上训练VT-CNN模型并评估其性能。
5:数据分析方法:
采用Top-1平均准确率作为评估方法性能的标准。
独家科研数据包,助您复现前沿成果,加速创新突破
获取完整内容