当前位置:主页 > 科技论文 > 计算机论文 >

嵌入式语音合成技术研究

发布时间:2018-02-09 02:50

  本文关键词: 语音合成 文语转换 语音库 语音索引模块 语音播放模块 出处:《北方工业大学》2012年硕士论文 论文类型:学位论文


【摘要】:语音合成是将文字信息转化为标准流畅的语音朗读出来的信息处理技术。语音合成技术自提出以来已经有百年历史。经过百余年来的研究和发展,语音合成技术在合成理念、合成算法和可实现性等方面取得了巨大的进步。该技术在人机交互,文字信息处理领域有着广泛的应用。 本文首先介绍了语音合成技术的发展及现状。其次对语音合成技术中的直接模拟发声法、共振峰语音合成、LPC合成、PSOLA等算法进行了系统的对比和分析研究。然后介绍了汉语语音知识和文本内容标准化的处理方法及流程。最后设计并实现了一种适于嵌入式系统上运行的文语转换系统。本文详述了该文语转换系统语音库的建立过程,包括语音单元的选择、多音字的处理、语音单元的连接、以及语音索引模块和语音播放模块的建立。 本文以C++编程语言建立了语音库、语音索引动态链接库、语音播放动态链接库,并以此为基础在不调用第三方组组件的情况下,实现了一个文本语音转换应用系统,具备文本到语音转换所需的基本功能。
[Abstract]:Speech synthesis is a kind of information processing technology that converts text information into standard and fluent speech reading. Speech synthesis technology has a history of one hundred years since it was put forward. After more than 100 years of research and development, speech synthesis technology is in the concept of synthesis. Great progress has been made in composition algorithm and realizability. This technology has been widely used in the field of human-computer interaction and word information processing. This paper first introduces the development and present situation of speech synthesis technology. The resonance peak speech synthesis / LPC synthesis algorithm PSOLA is compared and analyzed systematically. Then, the processing method and flow chart of standardization of Chinese phonetic knowledge and text content are introduced. Finally, a suitable embedding method is designed and implemented. In this paper, the establishment process of the speech corpus of the speech conversion system is described in detail. It includes the choice of speech unit, the processing of multi-tone word, the connection of speech unit, and the establishment of speech index module and speech playing module. In this paper, we set up a speech base, a speech index dynamic link library and a speech playback dynamic link library based on C programming language. Based on this, a text voice conversion application system is implemented without calling the third-party group components. Basic functions required for text-to-speech conversion.
【学位授予单位】:北方工业大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TN912.33;TP368.1

【参考文献】

相关期刊论文 前10条

1 韩纪庆;邵艳秋;;基于语音信号的情感处理研究进展[J];电声技术;2006年05期

2 王茂林;汉语自然话语韵律组块的优选论分析[J];暨南学报(哲学社会科学版);2005年04期

3 刘迁;贾惠波;;中文信息处理中自动分词技术的研究与展望[J];计算机工程与应用;2006年03期

4 徐英莹,张培仁;粤语语音合成系统语料库设计研究[J];计算机工程;2005年14期

5 叶振兴;蔡莲红;;一种基于决策树模型的音库构建和基元选取方法[J];计算机工程;2006年10期

6 王浩;李顺华;岳振军;;基于正弦谐波模型的语音变换技术[J];军事通信技术;2006年02期

7 李祖鹏,姚佩阳;一种高性能汉语语音基音周期估计方法[J];空军工程大学学报(自然科学版);2000年04期

8 霍华,普杰信,刘俊强,冯阳春,王平;基于基音同步叠加的汉语文语转换[J];洛阳工学院学报;2001年04期

9 徐辉,何克抗,孙波;书面汉语自动分词专家系统的实现[J];中文信息学报;1991年03期

10 徐秉铮,詹剑,贺前华;基于神经网络的分词方法[J];中文信息学报;1993年02期

相关硕士学位论文 前5条

1 段凯宇;吴语文语转换中语音合成与韵律控制的研究[D];苏州大学;2002年

2 李莉;维语文语转换系统的研究与实现[D];新疆大学;2004年

3 李锐;语音技术在塔台模拟机上的应用[D];四川大学;2004年

4 张鹏;嵌入式语音合成系统的研究与实现[D];武汉理工大学;2006年

5 王燕;中文口语交互式开放域问答系统关键技术研究[D];北京工商大学;2006年



本文编号:1496892

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1496892.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户af185***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com