基于图像超分辨率重建和视觉显著性的人体行为识别方法研究
发布时间:2021-02-05 20:10
随着互联网技术的不断发展和大型存储设备不断升级,网络上的视频数量急剧增多,对视频处理技术的质量要求不断提高,如何利用计算机高速处理视频数据、识别视频信息,已成为一个亟待解决的问题。对视频信息的识别,主要是对视频内容的处理,由于以人体行为为主要内容的视频数量在互联网视频总量中占比很高,所以研究人体行为识别技术尤为重要。传统的人体行为识别方法主要依赖模式识别与匹配技术,不仅识别灵活性不高,而且需要耗费大量的人工成本。随着人工智能技术的兴起,基于人工智能技术的人体行为识别成为研究热点,本文为提高基于人工智能技术的人体行为识别方法上的识别准确率,降低人体行为识别算法的硬件要求和训练成本,主要开展以下研究内容:(1)通过迁移学习构建人体行为识别神经网络,基于UCF-101数据集对神经网络进行训练,利用非共性特征层的微调优化输出结果,得到人体行为识别模型。(2)为在不提高批处理步长的前提下,解决局部最优解的问题,引入基于FSRCNN的图像超分辨率重建方法,通过对原始图像的超分辨率重建,主动增加图像内包含的信息,使损失函数能够在低处理步长下迅速收敛,提高识别准确率的同时降低神经网络对硬件配置的依赖程...
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:75 页
【学位级别】:硕士
【部分图文】:
Weizmann数据库
图 1-2 KTH 数据库图 1-3 UCF Sports 数据库库]由伊利诺大学香槟分校(UIUC)创建。该频序列都为 30 帧,这些视频由 8 个志愿的人类目标和背景己经提前由人工标记。s 数据库动数据库[4]如图 1-3 所示,由 10 种人体视频。此外,数据集内各个视频之间有较
- 4 -图 1-3 UCF Sports 数据库库]由伊利诺大学香槟分校(UIUC)创建。该数频序列都为 30 帧,这些视频由 8 个志愿的人类目标和背景己经提前由人工标记。s 数据库动数据库[4]如图 1-3 所示,由 10 种人体行视频。此外,数据集内各个视频之间有较行为拍摄过程中,摄像机跟随目标进行了
【参考文献】:
期刊论文
[1]基于二维离散分数阶傅里叶变换的视觉注意力算法[J]. 徐海波,史步海. 华南理工大学学报(自然科学版). 2018(08)
本文编号:3019507
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:75 页
【学位级别】:硕士
【部分图文】:
Weizmann数据库
图 1-2 KTH 数据库图 1-3 UCF Sports 数据库库]由伊利诺大学香槟分校(UIUC)创建。该频序列都为 30 帧,这些视频由 8 个志愿的人类目标和背景己经提前由人工标记。s 数据库动数据库[4]如图 1-3 所示,由 10 种人体视频。此外,数据集内各个视频之间有较
- 4 -图 1-3 UCF Sports 数据库库]由伊利诺大学香槟分校(UIUC)创建。该数频序列都为 30 帧,这些视频由 8 个志愿的人类目标和背景己经提前由人工标记。s 数据库动数据库[4]如图 1-3 所示,由 10 种人体行视频。此外,数据集内各个视频之间有较行为拍摄过程中,摄像机跟随目标进行了
【参考文献】:
期刊论文
[1]基于二维离散分数阶傅里叶变换的视觉注意力算法[J]. 徐海波,史步海. 华南理工大学学报(自然科学版). 2018(08)
本文编号:3019507
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3019507.html