基于音视频特征融合的暴力镜头识别方法研究

发布时间:2025-03-18 04:59
  暴力镜头检测是多媒体视频领域一项极其重要的任务,具有较高的研究价值和现实意义。目前多媒体视频的数量与日俱增,这给暴力镜头检测的速度带来了更高的要求。而且暴力镜头涉及的语义类型众多,包括打斗、尖叫、爆炸等,这也给暴力镜头检测任务带来了极大的挑战。当下绝大多数研究只涉及到某一种暴力类型,检测的种类相对单一,而且准确率较低,因而亟需面向多种语义类型的暴力镜头快速检测技术。首先,本文基于暴力的出现一般以镜头为最基本单位的原则,对多媒体视频进行了镜头分割,然后对单个镜头进行暴力识别。视频序列的镜头分割是视频检索中的关键技术之一。针对传统镜头分割方法在单一场景下分割效果差、对于渐变镜头检测准确率低等问题,本文出了一种基于视觉认知机理的视频镜头分割方法。该方法利用分块颜色直方图强化视觉显著区域,突出前后帧之间的差异特征,进一步高在单一场景下检测镜头切换的准确率。此外,基于人类对于视频图像亮度的视觉感知规律,利用滑动窗内相邻多帧之间的差异来捕捉镜头渐变时亮度的变化规律。与传统方法相比,本文所出的算法取得了较好的分割效果,具有较高的查准率和查全率。其次,本文分别从视觉通道、听觉通道、视听双通道对于单个镜头...

【文章页数】:71 页

【学位级别】:硕士

【部分图文】:

图1-1论文主要框架及结构安排图

图1-1论文主要框架及结构安排图

取常见的音频特征为主,很少有结合深度学习技术的方案。因此,在听觉通道结合目前主流的深度学习技术对于暴力镜头检测任务是一个全新的思路,并且对于视觉和听觉通道的特征融合也会供一定的帮助。1.4本文的主要研究内容及结构安排本文将围绕多媒体镜头分割和暴力镜头检测两个方面进行相关技术的....


图2-1突变镜头示意图

图2-1突变镜头示意图

哈尔滨工业大学工学硕士学位论文2.3基于视觉颜色分块直方图的突变镜头检测方法本文基于视觉认知机理对于突变镜头检测方法进行了深入研究。在突变镜头检测方面,本文出了视觉颜色分块直方图检测方法,有效解决了同一场景下不同镜头切换带来的准确率低等问题。2.3.1颜色直方图方法介绍在检....


图2-2HSV颜色模型示意图

图2-2HSV颜色模型示意图

图2-1突变镜头示意图视频帧差异时,常采用的衡量标准是颜色直方和镜头内物体的运动不敏感。颜色直方图是其横坐标表示了各个不同大小的区间,而纵素总数占所有像素个数的百分比。它述的例,而并不关心每种色彩所处的空间位置。而类感觉颜色的方式,封装了关于颜色的信息转换为HSV颜色空....


图2-3视频帧分块示意图

图2-3视频帧分块示意图

图2-3视频帧分块示意图图像如图2-4所示,经过上述的意图图2-5原进行分块后,计算出相邻两帧图V通道)的颜色直方图差异,如25501(,)()()2mimjmkdijHkHk==



本文编号:4036040

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/4036040.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户14101***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com