基于语义的汉语普通话电子喉语音转换增强
发布时间:2024-03-23 16:43
电子喉语音存在基频单一、发声机械、辐射噪声大等多种缺陷,这严重影响了电子喉语音可懂度和自然度,特别是对汉语普通话之类的声调语言,问题尤其严重.汉语普通话电子喉语音识别存在辅音混淆的问题并且识别结果没有声调,因此本文在识别结果的基础之上设计了拼音拼写修正器和声调标注工具,再结合基于Tacotron-2的TTS实现了电子喉语音向正常语音的转换.客观评价实验结果表明,拼音拼写修正器可以提高拼音准确率,声调标注在有上下文的语义环境中具有较高准确率.主观听力测试结果表明,本文所提方法在不同语言水平上提高了汉语普通话电子喉语音的可懂度和自然度.研究结果表明,本文设计的方法可以将不带声调的电子喉语音转换为正常语音,相比于传统语音转换方法具有更高的性能.
【文章页数】:6 页
【文章目录】:
1 引言
2 基于语义的电子喉语音增强
2.1 基于WaveNet-CTC的汉语普通话电子喉语音识别
2.2 基于编辑距离的拼音修正器
2.3 基于Bi-LSTM-CNNs-CRF的拼音声调标注
2.4 基于Tacotron-2的TTS
2.5 实验设置
2.5.1 数据准备
2.5.2 评价实验设计
3 实验结果
3.1 客观评价结果
3.2 主观评价结果
4 讨论与展望
5 结论
本文编号:3936195
【文章页数】:6 页
【文章目录】:
1 引言
2 基于语义的电子喉语音增强
2.1 基于WaveNet-CTC的汉语普通话电子喉语音识别
2.2 基于编辑距离的拼音修正器
2.3 基于Bi-LSTM-CNNs-CRF的拼音声调标注
2.4 基于Tacotron-2的TTS
2.5 实验设置
2.5.1 数据准备
2.5.2 评价实验设计
3 实验结果
3.1 客观评价结果
3.2 主观评价结果
4 讨论与展望
5 结论
本文编号:3936195
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3936195.html