研究目的
利用微调的深度卷积神经残差网络从视频中提取丰富的人群行为表征,并通过在特征图中创建子类并采用特征建模方案对其进行正则化来分类人群行为属性。
研究成果
所提出的框架结合了微调的深度卷积神经残差网络与子类判别分析,在人群行为识别任务中显著优于基线方法和当前最先进技术。通过空间划分树和特征正则化有效建模子类内方差,从而提升了识别率。
研究不足
该方法假设每个类别及其子类具有相等的先验概率,这在现实场景中可能并不总是成立。当特征数量较少时性能提升更为显著,表明其在处理高维数据方面可能存在局限性。
1:实验设计与方法选择:
该方法涉及使用人群行为视频对预训练的ResNet-50模型进行微调,通过空间分割树在特征图中创建子类,并对这些子类进行判别分析。
2:样本选择与数据来源:
使用包含来自8,257个场景的10,000个视频的WWW人群数据库。视频以每秒25帧的速率转换为图像,共提供219,094张图像。
3:实验设备与材料清单:
预训练的ResNet-50模型、空间分割树(PCA和RP决策树)、用于视频匹配的动态时间规整。
4:实验流程与操作步骤:
包括微调ResNet-50模型、提取特征、创建子类、进行判别分析以及使用动态时间规整进行视频匹配。
5:数据分析方法:
使用识别率和AUC评估性能,并将所提方法与基线方法和最先进方法进行比较。
独家科研数据包,助您复现前沿成果,加速创新突破
获取完整内容