双耳Ambisonics声重放系统的研究
发布时间:2020-11-18 08:11
Ambisonics是一种基于声场空间谐波分解与逐级近似重构的空间声重放方法。双耳Ambisonics是物理声场重构与双耳声压重构原理混合应用的一种空间声重放技术。它是将空间Ambisonics的扬声器信号分别用各自方向的一对头相关传输函数(HRTF,左右耳各一)进行滤波处理并叠加,模拟出扬声器重放所产生的双耳声信号并用耳机重放,产生类似于Ambisonics扬声器重放的听觉感知。双耳Ambisonics既可用于转换扬声器Ambisonics信号到双耳耳机重放,也可直接用于产生适合耳机重放的双耳信号。双耳Ambisonics是近年来空间声的一个研究热点。新一代空间声标准MPEG-H 3D Audio也包含了双耳Ambisonics的制式。国际上对双耳Ambisonics声已有一些研究,但总体上还处在发展阶段,仍有许多不足之处。主要体现在:大多数研究都是理论分析与仿真研究,感知特性的实验研究也主要局限在稳态双耳Ambisonics,真正实现动态双耳Ambisonics声重放的课题组不多。目前也缺少对该空间声重放方法的一个设计准则。此外,双耳Ambisonics同样受Shannon-Nyquist空间采样理论的限制,需要非常高阶的重放才能合成正确的双耳声压高频谱因素,这在实际的应用中是有困难的。动态因素有可能替代高频谱因素而产生垂直定位感知,但动态因素对垂直定位的作用还缺乏严格的证明。为此,本文开展了以下工作。开展了一系列的虚拟源定位实验,研究动态因素对听觉垂直定位的作用。结果表明,动态因素和谱因素都对垂直定位有贡献,但是两者提供的定位信息存在冗余;当缺少其中一种定位因素时,依靠另一种因素依然可以进行一定程度上的垂直定位;当两个因素都不存在时,听觉系统不能进行垂直定位;两个因素的协同作用将增强垂直定位;个性化的谱因素可以进一步提高稳垂直定位的准确性。这些结论将直接影响双耳Ambisonics声重放的设计。构建了国内首个,国际少数之一的实时的双耳Ambisonics声重放科学实验系统平台。该系统的重放阶数和虚拟扬声器的数目可根据实际需求灵活选择,系统的动态性能满足实验要求。基于该平台可对双耳Ambisonics声重放的效果和其他与动态Ambisonics相关的技术进行心理声学实验研究,同时该平台也可以为双耳Ambisonics声重放技术的应用提供重要的参考。详细分析了(虚拟)扬声器数目和重放阶数对双耳Ambisonics重放声压误差的影响,并采用了心理声学实验进行了验证。提出了双耳Ambisonics的应用和设计准则:实际可应用选择(L-1)=3~5阶的动态双耳Ambisonics,并采用略高于下限的(L+1)~2个虚拟扬声器,即可得到合理的定位效果。为了进一步提高重放效果,可以增加动态双耳Ambisonics的阶数,但系统也会更复杂。提出了一种双耳近场补偿高阶Ambisonics的方法,该方法混合应用了扬声器重放的近场补偿高阶Ambisonics和双耳虚拟听觉重放的基本原理,仅利用远场HRTF数据即可在耳机重放中合成不同距离和方向的听觉感知。并采用心理声学实验的方法证明,只需要5阶双耳近场补偿Ambisonics就可以得到合理的近场距离和方向的重放效果。实现了球形传声器阵列捡拾与双耳Ambisonics(动态)重放,详细分析了重放阶数和虚拟扬声器数目对球形传声器阵列捡拾与双耳Ambisonics重放双耳声压误差,并采用了心理声学的实验方法进行了验证。结果表明,尽管球形传声器阵列捡拾与双耳Ambisonics额外增加了声场捡拾产生的空间混叠误差,但重放阶数与扬声器数目对双耳声压误差的影响与通过信号处理合成Ambisonics信号的情况基本是一致的。本文工作是对双耳Ambisonics声重放的一个比较系统和全面的研究,能够为今后的双耳Ambisonics声重放的应用提供重要的参考。
【学位单位】:华南理工大学
【学位级别】:博士
【学位年份】:2019
【中图分类】:TN643
【部分图文】:
在 1.4.3 小节介绍。该动态 VAD 是基于个人计算机,在 Windows 操作系统下采用 C+语言实施。头踪迹跟踪器(Polhemus Fastrak,图 2-2)通过固定在头顶的电磁传感器检测头部的转动,该传感器能够检测头部三个自由度的转动(见图 2-1),即绕左右轴转动(pitch),绕前后轴转动(摆动,tilting),和绕上下轴转动(旋转,rotation)。对产生稳态的虚拟源,可将 VAD 平台的头踪迹跟踪器功能关闭,直接用一对目标方向 HRTF 按(1-5)式对输入信号滤波,得到双耳声信号。对产生动态的虚拟源,根据头踪迹跟踪器检测到的头部的方向,计算出空间固定声源相对于头部的现时位置,断刷新滤波用的 HRTF 数据,产生随头部转动的动态变化的双耳声信号。本动态 VA的场景刷新率和系统延时分别为 120 Hz 和 25.4 ms,能够很好地合成动态双耳信号,该系统的具体细节可以参考文献[85]。得到的双耳声信号馈给入耳式耳机(Etymotic ResearER-2,图 2-3)重放。该入耳式耳机的频率响应在 16 kHz 以下平直,并且 16 kHz 以上的信号成分对定位几乎没有作用,故在双耳信号的处理过程中省略了耳机到耳道的传输均衡。
在 1.4.3 小节介绍。该动态 VAD 是基于个人计算机,在 Windows 操作系统下采用 C+语言实施。头踪迹跟踪器(Polhemus Fastrak,图 2-2)通过固定在头顶的电磁传感器检测头部的转动,该传感器能够检测头部三个自由度的转动(见图 2-1),即绕左右轴转动(pitch),绕前后轴转动(摆动,tilting),和绕上下轴转动(旋转,rotation)。对产生稳态的虚拟源,可将 VAD 平台的头踪迹跟踪器功能关闭,直接用一对目标方向 HRTF 按(1-5)式对输入信号滤波,得到双耳声信号。对产生动态的虚拟源,根据头踪迹跟踪器检测到的头部的方向,计算出空间固定声源相对于头部的现时位置,断刷新滤波用的 HRTF 数据,产生随头部转动的动态变化的双耳声信号。本动态 VA的场景刷新率和系统延时分别为 120 Hz 和 25.4 ms,能够很好地合成动态双耳信号,该系统的具体细节可以参考文献[85]。得到的双耳声信号馈给入耳式耳机(Etymotic ResearER-2,图 2-3)重放。该入耳式耳机的频率响应在 16 kHz 以下平直,并且 16 kHz 以上的信号成分对定位几乎没有作用,故在双耳信号的处理过程中省略了耳机到耳道的传输均衡。
第二章 远场空间虚拟声源的定位因素情况类似,但是使用非个性化和个性化的 HRTF 的极仰角感知要优于使用无TF。因此,对于全频带粉红噪声,动态重放能够能够在一定程度上产生垂直面的虚拟源感知。而垂直定位感知误差的次序为:无耳廓 HRTF,非个性化性化 HRTF。图 2-7 是对图 2-6 中存在定位混乱的数据反演后的结果。直面 Θ = 45o,总体上,其极方位角感知误差比中垂面大,平均误差在 6.8见表 2-1)。图 2-8 至图 2-11 给出了目标虚拟源的极仰角定位散点图,其结果垂面类似。稳态重放 动态重放
【参考文献】
本文编号:2888509
【学位单位】:华南理工大学
【学位级别】:博士
【学位年份】:2019
【中图分类】:TN643
【部分图文】:
在 1.4.3 小节介绍。该动态 VAD 是基于个人计算机,在 Windows 操作系统下采用 C+语言实施。头踪迹跟踪器(Polhemus Fastrak,图 2-2)通过固定在头顶的电磁传感器检测头部的转动,该传感器能够检测头部三个自由度的转动(见图 2-1),即绕左右轴转动(pitch),绕前后轴转动(摆动,tilting),和绕上下轴转动(旋转,rotation)。对产生稳态的虚拟源,可将 VAD 平台的头踪迹跟踪器功能关闭,直接用一对目标方向 HRTF 按(1-5)式对输入信号滤波,得到双耳声信号。对产生动态的虚拟源,根据头踪迹跟踪器检测到的头部的方向,计算出空间固定声源相对于头部的现时位置,断刷新滤波用的 HRTF 数据,产生随头部转动的动态变化的双耳声信号。本动态 VA的场景刷新率和系统延时分别为 120 Hz 和 25.4 ms,能够很好地合成动态双耳信号,该系统的具体细节可以参考文献[85]。得到的双耳声信号馈给入耳式耳机(Etymotic ResearER-2,图 2-3)重放。该入耳式耳机的频率响应在 16 kHz 以下平直,并且 16 kHz 以上的信号成分对定位几乎没有作用,故在双耳信号的处理过程中省略了耳机到耳道的传输均衡。
在 1.4.3 小节介绍。该动态 VAD 是基于个人计算机,在 Windows 操作系统下采用 C+语言实施。头踪迹跟踪器(Polhemus Fastrak,图 2-2)通过固定在头顶的电磁传感器检测头部的转动,该传感器能够检测头部三个自由度的转动(见图 2-1),即绕左右轴转动(pitch),绕前后轴转动(摆动,tilting),和绕上下轴转动(旋转,rotation)。对产生稳态的虚拟源,可将 VAD 平台的头踪迹跟踪器功能关闭,直接用一对目标方向 HRTF 按(1-5)式对输入信号滤波,得到双耳声信号。对产生动态的虚拟源,根据头踪迹跟踪器检测到的头部的方向,计算出空间固定声源相对于头部的现时位置,断刷新滤波用的 HRTF 数据,产生随头部转动的动态变化的双耳声信号。本动态 VA的场景刷新率和系统延时分别为 120 Hz 和 25.4 ms,能够很好地合成动态双耳信号,该系统的具体细节可以参考文献[85]。得到的双耳声信号馈给入耳式耳机(Etymotic ResearER-2,图 2-3)重放。该入耳式耳机的频率响应在 16 kHz 以下平直,并且 16 kHz 以上的信号成分对定位几乎没有作用,故在双耳信号的处理过程中省略了耳机到耳道的传输均衡。
第二章 远场空间虚拟声源的定位因素情况类似,但是使用非个性化和个性化的 HRTF 的极仰角感知要优于使用无TF。因此,对于全频带粉红噪声,动态重放能够能够在一定程度上产生垂直面的虚拟源感知。而垂直定位感知误差的次序为:无耳廓 HRTF,非个性化性化 HRTF。图 2-7 是对图 2-6 中存在定位混乱的数据反演后的结果。直面 Θ = 45o,总体上,其极方位角感知误差比中垂面大,平均误差在 6.8见表 2-1)。图 2-8 至图 2-11 给出了目标虚拟源的极仰角定位散点图,其结果垂面类似。稳态重放 动态重放
【参考文献】
相关期刊论文 前7条
1 刘阳;谢菠荪;;Ambisonics声捡拾与重放音色的双耳听觉模型分析与实验[J];声学学报;2015年05期
2 余光正;谢菠荪;饶丹;;人工头近场头相关传输函数及其特性[J];声学学报;2012年04期
3 谢菠荪;;头相关传输函数空间采样、插值与环绕声重放[J];声学学报(中文版);2007年01期
4 谢菠荪,师勇,谢志文,管善群;5.1通路环绕声的虚拟重放系统[J];声学学报;2005年03期
5 谢菠荪;6.1通路通用平面环绕声系统的研究[J];声学学报;2001年06期
6 谢兴甫;三维(立体)声场的数学分析[J];声学学报;1988年05期
7 谢兴甫;全景(立体)声的4-3-4变换与N(≥3)通路重发[J];华南工学院学报;1978年02期
相关博士学位论文 前3条
1 刘昱;球形传声器阵列捡拾与双耳虚拟重放系统的研究[D];华南理工大学;2015年
2 刘阳;Ambisonics声重放系统的稳定性与音色的研究[D];华南理工大学;2014年
3 张承云;虚拟听觉环境实时绘制系统平台研究[D];华南理工大学;2012年
相关硕士学位论文 前2条
1 林慧镔;基于安卓手机的动态虚拟听觉重放[D];华南理工大学;2017年
2 陈嘉衍;基于Kinect的动态虚拟听觉重放[D];华南理工大学;2016年
本文编号:2888509
本文链接:https://www.wllwen.com/kejilunwen/dianzigongchenglunwen/2888509.html