当前位置:主页 > 科技论文 > 软件论文 >

基于四元数时空卷积神经网络的人体行为识别

发布时间:2024-05-29 00:28
  传统卷积神经网络(CNN)只适用于灰度图像或彩色图像分通道的特征提取,忽视了通道间的空间依赖性,破坏了真实环境的颜色特征,从而影响人体行为识别的准确率。为了解决上述问题,提出一种基于四元数时空卷积神经网络(QST-CNN)的人体行为识别方法。首先,采用码本算法预处理样本集所有图像,提取图像中人体运动的关键区域;然后将彩色图像的四元数矩阵形式作为网络的输入,并将CNN的空间卷积层扩展为四元数空间卷积层,将彩色图像的红、绿、蓝通道看作一个整体进行动作空间特征的提取,并在时间卷积层提取相邻帧的动态信息;最后,比较QST-CNN、灰度单通道CNN(Gray-CNN)和RGB 3通道CNN(3Channel-CNN)3种方法的识别率。实验结果表明,所提方法优于其他流行方法,在Weizmann和UCF sports数据集分别取得了85.34%和80.2%的识别率。

【文章页数】:8 页

【部分图文】:

图I人体运动关键区域提取示例

图I人体运动关键区域提取示例

第11期??孟勃等:基于四元数时空卷积神经网络的人体行为识别??2645??式中:〇:(〇(?<?1)和识/3?>?1)为亮度范围的阈值。另外,??颜色标准定义为:??CC;(?*,,!;,?)=??J(R2?+?G2?+?B2)-??(R,R?+?G,G?+?B,B)??R,2....


图2QST-GNN的网络结构

图2QST-GNN的网络结构

第11期??孟勃等:基于四元数时空卷积神经网络的人体行为识别??2645??式中:〇:(〇(?<?1)和识/3?>?1)为亮度范围的阈值。另外,??颜色标准定义为:??CC;(?*,,!;,?)=??J(R2?+?G2?+?B2)-??(R,R?+?G,G?+?B,B)??R,2....


图3Gray-CNN和3Channel-CNN的结构

图3Gray-CNN和3Channel-CNN的结构

2646??仪器仪表学报??第3?8卷??1)


图5?UCF?sports数据集上本文方法的混淆矩阵??Fig.?5?Confusion?matrix?for?the?UCF?sports?dataset??

图5?UCF?sports数据集上本文方法的混淆矩阵??Fig.?5?Confusion?matrix?for?the?UCF?sports?dataset??

2648??仪器仪表学报??第3?8卷??跳水??打高尔夫??踢球??举重??骑马??跑少??滑板??鞍马??单双杠??行走??%%?%?%?\?%??图5?UCF?sports数据集上本文方法的混淆矩阵??Fig.?5?Confusion?matrix?for?the?UCF?....



本文编号:3983824

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3983824.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d6dd3***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com