相位信息对重构语音声调和音乐旋律感知影响的研究
发布时间:2017-09-02 17:43
本文关键词:相位信息对重构语音声调和音乐旋律感知影响的研究
更多相关文章: 相位特征 声调感知 音调感知 声音嵌合 重构语音
【摘要】:声调感知和音乐感知差是目前人工耳蜗产品存在的主要问题之一。声调本质是音高的变化模式,音乐旋律的表达是不同音高的音符按一定组合关系连接而形成的,两者都是音高变化的表现。声信号的完整表达由三个主要特征构成,幅度特征、频率特征和相位特征。目前,人工耳蜗常用编码策略均能较好地表达声信号的幅度特征和频率特征,而相位特征常被忽略或未作专门处理。因此,相位特征和音高感知之间的关系值得深入研究。本文用信号分析再重构的方法,采用短时傅里叶变换技术,利用主观测听评估方式,对语音声调和音乐旋律感知与相位特征的关系进行了若干实验研究,并给出研究结论。(1)在常用窗长相位变化实验中,当相位特征置零,实验发现,此时重构音节音质下降,但音节识别率未明显下降(大于92%),而重构音节的四声调型几乎都听成“阴平”(即一声),无四声变化;当相位特征随机分布,实验发现,此时重构音节四种调型可部分识别,音质较零相位时有所下降,从而表明,相位特征对声调感知有明显的影响。(2)当改变窗长时,用零相位特征重构音节,声调测试发现,当窗长缩短至较短时,如2ms或1ms,重构音节的声调又恢复。该结果表明:窗长缩短(即信号时间分辨率提高),即使在相位特征缺失下,声调特征仍较好保留。(3)进一步,采用声音嵌合重构方法,即用不同调型音节的幅频特征与相位特征交叉嵌合、重构音节,测听嵌合重构音的声调,结果发现:嵌合音的四种调型均以较高的识别率与提供相位特征的音节调型一致。由此推断:声调的感知主要取决于相位特征。(4)为研究音乐旋律和相位特征的关系,也进行了常用窗长零相位重构实验和变窗长零相位实验。在常用窗长下,实验发现,音乐旋律识别效果差,大都听为“平调”;当窗长缩短至1ms,音乐旋律又可识别。该结果也表明:音乐旋律的表达与相位特征密切相关,提高时间分辨率同样可以弥补相位特征缺失对音高感知的影响。研究结论:相位特征对音高感知有显著影响,且该影响与重构窗长密切相关。
【关键词】:相位特征 声调感知 音调感知 声音嵌合 重构语音
【学位授予单位】:山东大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN912.3
【目录】:
- 摘要8-9
- ABSTRACT9-11
- 缩略语简表11-12
- 第一章 绪论12-20
- 1.1 课题提出的背景和意义12-13
- 1.2 人工耳蜗在声调识别和音乐感知方面的发展现状和存在的问题13-18
- 1.2.1 人工耳蜗在声调识别方面的发展现状13-15
- 1.2.2 人工耳蜗在音乐旋律识别方面的发展现状15-16
- 1.2.3 人工耳蜗在声调和音调识别方面存在的问题16-18
- 1.4 本文研究的主要的内容18-20
- 第二章 声信号听觉感知机理与信号产生模型20-27
- 2.1 声信号的听觉感知机理20-21
- 2.2 声信号的产生模型21-23
- 2.3 声信号傅里叶分析23-26
- 2.3.1 声信号的加窗分析24-25
- 2.3.2 短时傅里叶分析25-26
- 2.4 本章小结26-27
- 第三章 声信号的实验原理及实验准备27-32
- 3.1 实验原理27-29
- 3.1.1 相位变化重构实验原理27
- 3.1.2 嵌合实验原理27-29
- 3.2 实验测听方法29-30
- 3.3 测试用原材料及测试人员30
- 3.4 本章小结30-32
- 第四章 相位对声调感知实验探究32-44
- 4.1 语音声调的声学特征32-33
- 4.2 相位变化重构实验33-39
- 4.2.1 常用窗长的相位变化重构实验33-38
- 4.2.2 变换窗长零相位重构实验38-39
- 4.3 嵌合实验39-42
- 4.4 本章小结42-44
- 第五章 相位对音乐旋律感知的实验探究44-50
- 5.1 音乐信号的基本特征44-45
- 5.2 零相位实验研究45-49
- 5.2.1 常用窗长零相位重构实验45-48
- 5.2.2 变窗长零相位重构实验48-49
- 5.3 本章小结49-50
- 第六章 总结和展望50-52
- 参考文献52-57
- 致谢57-58
- 攻读硕士研究生期间学术成果58-59
- 附件59
【参考文献】
中国期刊全文数据库 前4条
1 陈雪清;刘海红;;语前聋患者人工耳蜗植入后声调识别能力研究[J];听力学及言语疾病杂志;2010年01期
2 李时中;;谈钢琴弦列最佳击弦点的理论与实践[J];乐器;1992年01期
3 李允公;张金萍;戴丽;张占一;刘杰;;基于听觉模型ZCPA的故障诊断特征提取方法研究[J];中国机械工程;2009年24期
4 徐立;;言语识别中的时域及频域信息[J];中华耳科学杂志;2006年04期
中国博士学位论文全文数据库 前1条
1 毛弈韬;人工耳蜗植入儿童声调感知与发声及歌唱能力研究[D];中南大学;2014年
,本文编号:779993
本文链接:https://www.wllwen.com/kejilunwen/wltx/779993.html