当前位置:主页 > 科技论文 > 网络通信论文 >

三维音频中主声源—环境声提取算法的研究

发布时间:2020-07-24 11:20
【摘要】:随着3D游戏和家庭影院等数字多媒体的发展,消费者要求更加身临其境的聆听体验。沉浸式听音体验是使用回放设备对录制的音频内容进行空间音频再现的目标。为了实现高效的空间音频再现,受人类听觉系统的启发,声场被认为是前景声音(Primary,主声源)和背景声音(Ambient,环境声成分)的线性组合。由于人耳对主声源和环境声成分存在感知差异,通过对主声源和环境声成分分别使用不同的渲染方案,可以保留各个成分独有的空间特性,并实现沉浸式的空间音频再现效果。由于现有的基于声道的音频信号都是不同音频成分的线性组合,这就需要从混合信号中提取主声源和环境声,这个过程被称为主声源-环境声提取(Primary-Ambient Extraction,PAE)。准确的PAE算法,可以很好的提高再现空间音频的质量。本文着重研究多声道和多主声源的PAE算法,以期通过更准确的PAE算法来实现高效的空间音频再现。现有的PAE算法多是针对立体声信号的,而针对多声道信号的PAE算法不够完善。现有多声道PAE算法计算复杂度较高,以及空间性能较差等问题。为了得到更准确的多声道PAE算法,本文分析了现有的多声道PAE算法,并提出了基于最小二乘法的多声道PAE算法,解决了现有算法计算复杂度较高和空间性能较差的问题,使多声道PAE算法具有更优的提取性能。通过实验证明,本文提出的算法在空间精确性和计算复杂度上都明显优于现有的多声道PAE算法。通过研究现有的PAE算法,发现目前PAE算法的主要处理对象还是单一主声源的混合音频,而对于多主声源混合音频的研究,很少涉及。本文针对多主声源PAE算法的研究现状,介绍了传统基于PCA的多主声源PAE算法,并在传统方法的基础上引入一个量化主声源和环境声能量的参数,设置阈值对主声源的提取进行控制。实验证明,本文提出的方法在主声源的提取性能上明显优于传统算法,解决了传统PCA算法误差较高的问题,平均降低了 5dB的误差信号比。本文对多声道以及多主声源PAE算法进行了深入的研究和讨论,并在传统方法基础上做出了改进。其最主要的目的还是得到更准确的PAE算法,以通过更准确的PAE提取来实现沉浸式的空间音频再现听音体验。
【学位授予单位】:武汉大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TN912.3
【图文】:

构造图,构造图,声源


间中的特定声源,声源的定位将涉及三个维度,显然,聆听者的头部)作为空间的中心的极坐标系统被认为最空间。因此,如图2-2所示,进行声源定位时将三维描述角0。距离是声源和头部中心之间直线路径的长度。水平与地面水平的平面。中心平面是垂直于水平面的垂直平的原点。方位角0指中间平面与从头部中心到声源位置角0通常以顺时针方向定义,0°方位角指的是我们前方为水平面与从头部中心到声源位置的矢量之间的角度。源定位在头部的正前方,并且高度角越大,声源位置就头部后面,甚至到头部下面。逡逑—'^源逡逑

三维音频中主声源—环境声提取算法的研究


声翻定位

声道,环境声


三维音频中主声源-环境声提取算法的研究幅度平移。实验目标主要是,选取一段录音W1作为主声W2邋(这里认为环境声是一个白高斯噪声,且使用具有进行了去相关操作)作为环境声成分。在实验中,由于声幅度平移得到,而环境声成分在声道间具有相同的能量,且W可以通过线性组合W1和W2得到。为了模拟从声道i被要声源平移因子按=邋4,邋2,邋1进行缩放。随后,通过主化线性混合W1和W2得到L接下来,通过计算前面提些PAE算法进行评估比较,并基于实验结果进行分析,点。逡逑用的是5.邋1声道的音频,其配置如下:逡逑J_L逦,,逡逑

【相似文献】

相关期刊论文 前10条

1 刘锦峰;戴金升;王宁宇;;人声源定位机制及其临床评估[J];听力学及言语疾病杂志;2018年02期

2 郭业才;马伟伟;朱赛男;;基于混沌人工蜂群优化的声源定位算法[J];系统仿真学报;2017年06期

3 刘一鼎;;关于声源定位及运动状态测定的研究[J];中学生数理化(学习研究);2017年12期

4 李嘉;张国庆;段生许;黄海莲;;基于传声器阵列的声源定位技术的应用[J];环境工程;2012年S1期

5 蒋婷;刘建平;;基于麦克风阵列声源定位的发展历程及关键技术[J];科技资讯;2011年35期

6 林运;杨卫东;朱晓天;;声源定位法在柴油机噪声控制中的应用[J];柴油机设计与制造;2007年01期

7 董洪光;李新光;;二维声源定位算法仿真[J];电子测量技术;2004年02期

8 徐彦廷,李伟,戴光,孙茂成,于江林;声源定位问题研究及误差分析[J];无损检测;1999年05期

9 向兵;刘敬彬;;基于单片机的声源定位设计[J];科学技术创新;2018年31期

10 周利;刘庆华;;一种基于区域收缩的分布式声源定位方法[J];桂林电子科技大学学报;2016年01期

相关会议论文 前10条

1 张普芬;陈华伟;;改进的非参贝叶斯室内声源个数估计方法[A];2018年全国声学大会论文集 K语言声学与语音信号处理[C];2018年

2 原晶晶;;3-7岁正常儿童声源定位能力的研究[A];2010全国耳鼻咽喉头颈外科中青年学术会议论文汇编[C];2010年

3 李元首;张伟;陈宝;张雪;周国成;;模拟汽车运动声源定位技术研究[A];2017汽车空气动力学分会学术年会论文集[C];2017年

4 魏龙;张忠;秦朝红;黎敏;刘振皓;郭静;;气动测试中强气流背景噪声下的声源定位方法[A];北京力学会第二十四届学术年会会议论文集[C];2018年

5 丁建策;郑成诗;李晓东;;双耳相干混响比加权的声源定位算法[A];中国声学学会2017年全国声学学术会议论文集[C];2017年

6 李倩倩;阳凡林;张凯;;不确定海洋环境下多声源定位算法研究[A];2017中国西部声学学术交流会论文集[C];2017年

7 李盼;郭建中;;声源定位的噪声适应性研究[A];2017年西安-上海声学学会第五届声学学术交流会议论文集[C];2017年

8 刘哲;陈日林;罗伦楷;滕鹏晓;杨亦春;;探测距离对声源定位精度的影响[A];泛在信息社会中的声学——中国声学学会2010年全国会员代表大会暨学术会议论文集[C];2010年

9 黄益旺;杨士莪;吕钱浩;;基于时延的匹配场声源定位[A];中国声学学会2002年全国声学学术会议论文集[C];2002年

10 李剑汶;章宇栋;童峰;洪青阳;;基于非均匀范数稀疏恢复的麦克风阵列远场声源定位[A];第十四届全国人机语音通讯学术会议(NCMMSC’2017)论文集[C];2017年

相关重要报纸文章 前2条

1 本报记者 李丽云 通讯员 陈淑娟 金声;声音变产品 智慧广场舞不再扰民[N];科技日报;2018年

2 新城;小声音 大前景[N];计算机世界;2006年

相关博士学位论文 前10条

1 阚阅;基于多基阵传声器阵列的被动式声源定位研究[D];哈尔滨工业大学;2018年

2 钟迪;管道内热声源定位的理论与实验研究[D];清华大学;2016年

3 黄益旺;浅海远距离匹配场声源定位研究[D];哈尔滨工程大学;2005年

4 陈韶华;海洋声源信息获取与传输技术研究[D];西北工业大学;2006年

5 周悦;信息理论准则下的匹配场声源定位[D];浙江大学;2015年

6 杨志国;马尔可夫状态—空间模型下的声源定位与跟踪[D];浙江大学;2013年

7 韩闯;水下运动声源定位及复杂噪声源分离量化方法研究[D];哈尔滨工程大学;2015年

8 吕晓玲;基于听觉信息的机器人声源定位技术研究[D];河北工业大学;2010年

9 周成;人耳声源定位与编码技术研究[D];武汉大学;2011年

10 崔玮玮;基于麦克风阵列的声源定位与语音增强方法研究[D];清华大学;2009年

相关硕士学位论文 前10条

1 宋定艳;三维音频中主声源—环境声提取算法的研究[D];武汉大学;2018年

2 王家璇;环卫洗扫车声源识别及噪声控制[D];华中科技大学;2018年

3 李荣;基于ELM-AE和分布矩阵的挖掘设备声源定位方法[D];杭州电子科技大学;2018年

4 王枭;基于声阵列的风轮声源追踪识别研究[D];内蒙古工业大学;2018年

5 崔浩;声源定位中盲源分离算法的研究与实现[D];山东大学;2018年

6 高传海;快速部署分布式声源定位系统节点设计[D];西安工业大学;2018年

7 张坤;基于嵌入式的麦克风阵列声源定位系统算法研究[D];西安工业大学;2018年

8 叶春煦;基于麦克风阵列的声源定位系统设计与实现[D];哈尔滨工程大学;2018年

9 刘陈;基于麦克风阵列的声源定位研究[D];湖北工业大学;2018年

10 朱鹏飞;听觉与视觉联合目标跟踪仿生系统的研制[D];郑州大学;2018年



本文编号:2768769

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/2768769.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户6c272***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com