您当前的位置: > 详细浏览

基于改进的深度神经网络的人体动作识别模型

请选择邀稿期刊:
摘要: 针对现有人体动作识别方法需输入固定长度的视频段、未充分利用时空信息等问题,提出一种基于时空金字塔和注意力机制相结合的深度神经网络模型,将包含时空金字塔的3D-CNN和添加时空注意力机制的LSTM模型相结合,实现了对视频段的多尺度处理和对动作的复杂时空信息的充分利用。以RGB图像和光流场作为空域和时域的输入,以融合金字塔池化层的运动和外观特征后的融合特征作为融合域的输入,最后采用决策融合策略获得最终动作识别结果。在UCF101和HMDB51数据集上进行实验,分别取得了94.2%和70.5%的识别准确率。实验结果表明,改进的网络模型在基于视频的人体动作识别任务上获得了较高的识别准确率。

版本历史

[V1] 2018-09-12 14:24:03 ChinaXiv:201809.00059V1 下载全文
点击下载全文
预览
许可声明
metrics指标
  •  点击量2353
  •  下载量1229
评论
分享