当前位置:主页 > 科技论文 > 网络通信论文 >

基于稀疏表示和主题模型的音频分类识别研究

发布时间:2020-03-21 22:00
【摘要】:音频信息作为人们对外界环境感知的一种重要手段,在视线遮挡、光照条件差及隐私场合等情况下可以对视觉信息起到辅助作用,且具有视觉信息无法替代的作用。随着多媒体信息的快速发展和音频信息量的急速增长,人们对音频信息管理和应用的需求越来越大,音频信息的研究得到越来越广泛的关注。音频信息具有广泛的应用前景,例如音频情感感知,智能家居工程以及基于音频信息的场景识别等。音频事件分类和音频场景识别是音频分类领域的两个重要研究方向,近年来得到研究者们的广泛关注。本论文基于稀疏表示技术和主题模型技术对音频事件分类及音频场景识别展开研究,主要研究工作包括:(1)本文提出了一种基于堆叠基稀疏表示的音频事件分类方法。该方法通过K-SVD算法为每一类音频事件分别训练创建音频字典,在得到每一类音频事件的基函数以后,通过将各类的基函数进行堆叠得到一个大型的音频字典,最后基于新创建的大型音频字典提取音频信号的稀疏表示特征。在分类阶段,本文提出通过计算样本在各类音频事件上的权重值,然后根据权重值的大小进行判别的分类策略。在进行语音-音乐二类分类实验时,本文提出的分类方法的分类正确率高达100%。在TIMIT数据库上进行说话人识别实验时,其分类准确率高达95%,比英国萨里大学Syed Zubair提出的最大值池化稀疏方法提高了13%。(2)本文提出了一种基于音频事件和主题模型的音频场景识别方法。与传统的基于文档-字共现矩阵(document-word co-occurrence matrix)进行主题分析的方法不同,本文提出的算法通过创建音频文档-音频事件共现矩阵进行主题分析,算法的创新性体现在:1)与传统的基于文档-字共现矩阵进行主题分析的方法相比,本文基于音频文档-音频事件共现矩阵进行主题分析能更好地提取音频文档的主题分布,更好地表达音频文档,进而获得更好的识别效果;2)提出了一种简单的音频文档-音频事件共现矩阵的统计方法;3)提出了一种对音频文档的事件分布进行加权的方法,这种加权方法可以突出反映音频文档独特主题的重要音频事件,并且可以抑制许多主题共有的音频事件。在AASP数据库和DEMAND数据库上的实验表明,在识别性能上,本文提出的基于音频文档-音频事件共现矩阵的音频场景识别方法优于传统的基于音频文档-音频字共现矩阵的音频场景识别方法。
【图文】:

模型矩阵,主题


LDA 为 引入了Dirichlet 先验分布。基于 LDA 模型的文本集生成过程如根据分布( )( )id Dirichlet 采样生成文档id 的主题分布对于文档id 中的每个单词 wk:(a)根据文档id的主题分布( )id 选择一个主题jz(b)选择( )( )jz Dirichlet (c)从多项分布( )jz 中选取一个字kwA 模型的学习方法有很多,最常用的两种方法是吉布斯采样法和变分推理法变分推理法。PLSA 和 LDA 是两种不同的主题模型,正如 M.Stevvers 教授在指出的,主题模型可以认为是一种矩阵分解[40],其矩阵分解如下图 3-1 所示C 表示文档-字共现矩阵,,对其进行分解得到主题-字分配矩阵和文档-主题分
【学位授予单位】:山东师范大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TN912.34

【相似文献】

相关期刊论文 前10条

1 Fang LI;Jia SHENG;San-yuan ZHANG;;基于稀疏表示的拉普拉斯稀疏字典图像分类(英文)[J];Frontiers of Information Technology & Electronic Engineering;2017年11期

2 陈素素;谢宏;;基于稀疏表示的联合多通道肌电信号手势识别[J];微型机与应用;2017年17期

3 余庆辉;朱晗琰;吴海霞;戈晓玲;潘逸炜;;基于类内稀疏表示的人脸识别[J];科技展望;2015年32期

4 滕升华;商胜楠;王芳;赵增顺;;一种基于复合稀疏表示的阿尔茨海默病的诊断方法[J];生物医学工程研究;2016年01期

5 黄宏图;毕笃彦;高山;查宇飞;侯志强;;基于局部敏感核稀疏表示的视频跟踪[J];电子与信息学报;2016年04期

6 张保庆;穆志纯;曾慧;;基于非负稀疏表示的遮挡人耳识别[J];计算机辅助设计与图形学学报;2014年08期

7 张石清;赵小明;楼宋江;闯跃龙;郭文平;陈盈;;一种局部敏感的核稀疏表示分类算法[J];光电子.激光;2014年09期

8 陈思宝;许立仙;罗斌;;基于多重核的稀疏表示分类[J];电子学报;2014年09期

9 李映;张艳宁;许星;;基于信号稀疏表示的形态成分分析:进展和展望[J];电子学报;2009年01期

10 王威;朱宗玖;陆俊;;基于字典学习和局部约束的稀疏表示人脸识别[J];电脑知识与技术;2018年05期

相关会议论文 前10条

1 樊亚翔;孙浩;周石琳;邹焕新;;基于元样本稀疏表示的多视角目标识别[A];2013年中国智能自动化学术会议论文集(第五分册)[C];2013年

2 杨宝;朱启兵;黄敏;;基于非负矩阵分解一稀疏表示分类的玻璃缺陷图像识别[A];第24届中国控制与决策会议论文集[C];2012年

3 田野;张立新;严涛;杨志梅;张茁;;基于稀疏表示的北斗导航卫星预失真滤波器设计方法[A];第九届中国卫星导航学术年会论文集——S08 测试评估技术[C];2018年

4 肖琼;黄永言;;稀疏表示在脑电信号处理中的应用研究现状[A];人-机-环境系统工程创立30周年纪念大会暨第十一届人-机-环境系统工程大会论文集[C];2011年

5 赵雪峰;孙成禹;;基于稀疏表示的地震多属性融合[A];2016中国地球科学联合学术年会论文集(十九)——专题40:油气田与煤田地球物理勘探[C];2016年

6 廖佳俊;刘志刚;蔡尚;姜江军;;基于非负—平滑约束的高光谱稀疏表示目标检测算法研究[A];国家安全地球物理丛书(十二)——地球物理与信息感知[C];2016年

7 蒙红英;柴昱洲;韩宇;;一种基于稀疏表示的JPEG-LS改进算法[A];第四届高分辨率对地观测学术年会论文集[C];2017年

8 柴汉超;郭翌;汪源源;曹万里;孙福康;;基于多尺度稀疏表示分割肾上腺肿瘤CT图像[A];仪器仪表学报(2015(增刊)第36卷)[C];2015年

9 余力;郭翌;汪源源;陈萍;;基于超声心动图序列的胎儿左心室分割[A];仪器仪表学报(2015(增刊)第36卷)[C];2015年

10 林哲;闫敬文;袁野;;基于稀疏表示和PCNN的多模态图像融合[A];创新驱动与转型发展,推动汕头腾飞——汕头市科协第七届学术年会优秀论文集[C];2014年

相关博士学位论文 前10条

1 李斐;稀疏约束下的图像分类与特征提取算法研究[D];山东大学;2018年

2 张海燕;基于稀疏表示的低剂量CT成像研究[D];天津大学;2017年

3 徐琳琳;基于稀疏优化的几何建模研究[D];中国科学技术大学;2018年

4 王斌;基于稀疏表示和深度学习的图像识别算法及应用研究[D];中国科学技术大学;2018年

5 程增飞;基于压缩感知的阵列信号处理技术研究[D];西安电子科技大学;2017年

6 王伟;基于帧级和段级稀疏表示的说话人识别研究[D];哈尔滨工业大学;2016年

7 涂淑琴;基于稀疏表示的RGB-D图像特征学习研究与应用[D];华南农业大学;2016年

8 李窦哲;基于L-DACS1数据链的航空电信网协同传输关键技术研究[D];天津大学;2017年

9 石保顺;基于自适应稀疏表示的压缩感知及相位恢复算法研究[D];燕山大学;2017年

10 刘梓;基于稀疏表示与鉴别分析算法的人脸图像分类研究[D];南京理工大学;2016年

相关硕士学位论文 前10条

1 汤浩;核空间联合稀疏表示高光谱图像分类及GPU实现[D];西南交通大学;2018年

2 周红莲;基于卷积稀疏表示与组合核方法的高光谱图像分类研究[D];西南交通大学;2018年

3 周耐;基于稀疏表示和主题模型的音频分类识别研究[D];山东师范大学;2018年

4 杨世诚;基于稀疏表示的低质量人脸图像识别的研究[D];华东师范大学;2018年

5 翟奥博;基于稀疏表示的SAR图像分类模型及其算法的研究[D];天津理工大学;2018年

6 吴玲玲;诱发电位少次提取方法的研究[D];江苏师范大学;2018年

7 张晋源;基于联合稀疏表示的非局部变换域图像去噪[D];北京邮电大学;2018年

8 李育亮;智能机器人视觉图像最稀疏分解研究[D];兰州理工大学;2018年

9 马超;基于稀疏表示和概率主元分析的化工过程故障检测与识别[D];华东交通大学;2018年

10 张祺威;基于稀疏表示理论的声发射识别技术的研究[D];东南大学;2017年



本文编号:2593999

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/2593999.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户dd67f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com