当前位置:主页 > 科技论文 > 信息工程论文 >

基于稀疏表示和深层神经网络的音频场景识别研究

发布时间:2023-04-10 05:41
  音频场景识别是指通过对环境音的理解来判断所处的场景,其在现实生活中具有广阔的应用前景,可以广泛用于多媒体检索、智能家居、智能机器人、安全监控、智能终端等领域,因而具有重要的研究价值。本文基于稀疏表示和深层神经网络对音频场景识别展开研究,提出了四种融合方法进行音频场景识别,具体研究内容包括:1)提出了一种前端特征融合方法对于音频片段内的各个音频帧,前端特征融合方法将基于稀疏表示求得的得分值特征和log-mel频谱特征进行融合,将特征融合后的音频片段作为DCNN网络的输入,通过DCNN网络进行音频场景识别。基于稀疏表示的得分特征从音频基空间的角度反映了场景类的分布,而log-mel频谱特征则反映了音频的声学特征,这两组完全不同的特征从不同的角度挖掘音频信息,两类特征互补,使得融合后的特征信息量大于每一类特征的单一信息量。2)提出了一种后端特征融合方法后端特征融合方法分别将基于稀疏表示特征求得的得分特征和log-mel频谱特征作为DCNN网络的输入,由DCNN网络提取深度特征,最后将两种深度特征融合后通过DCNN网络进行音频场景识别。后端特征融合方法的识别性能优于融合前的识别方法,且其性能整...

【文章页数】:66 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第一章 绪论
    1.1 课题研究背景及意义
    1.2 课题研究现状
    1.3 本文的主要工作及内容安排
第二章 基于深层神经网络的音频场景识别
    2.1 CNN网络
    2.2 LSTM网络
    2.3 实验
        2.3.1 实验数据及实验设置
        2.3.2 实验结果及分析
    2.4 本章小节
第三章 基于稀疏表示和深层神经网络的音频场景识别
    3.1 稀疏表示算法介绍
    3.2 本文提出的融合算法
        3.2.1 前端特征融合方法
        3.2.2 后端特征融合方法
        3.2.3 决策值融合方法1
        3.2.4 决策值融合方法2
    3.3 实验
        3.3.1 实验数据及实验设置
        3.3.2 实验结果及分析
    3.4 本章小节
第四章 总结与展望
参考文献
攻读学位期间发表的学术成果
致谢



本文编号:3788432

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3788432.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9bcac***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com