当前位置:主页 > 教育论文 > 对外汉语论文 >

基于生成性词库分词技术的汉语拼音自动转换研究

发布时间:2020-02-24 10:54
【摘要】: 本文的研究目标是为上层语言应用,比如语音输出、拼音读物排版系统、对外汉语教学等,提供一个高效率、高准确度的把汉字文本自动转换成汉语拼音的算法。算法的核心是识别汉字的多音字。 我们通过研究,发现只有在词处理层面才能较好地识别多音字。因此,我们第一步的工作是进行自动分词的研究,这个研究是建立在优化和完善湖南大学罗海清的生成性词库分词技术上的。通过扩充基本语素以及对应的前加语素和后加语素、增加专业名称和成语词表等研究,大幅度地提高了分词的准确度。第二步,在自动分词的基础上,我们采集了GB2312字符集中所有的多音字和它们对应的词,设计算法把汉字词转换成汉语拼音词,同时在程序中还对音变进行了处理。通过不断地试验,我们最终的汉字文本转汉语拼音程序能达到99%的准确度,基本满足了实际应用的需求。
【学位授予单位】:湖南师范大学
【学位级别】:硕士
【学位授予年份】:2009
【分类号】:H08

【相似文献】

相关期刊论文 前10条

1 冯银平;;借助汉语拼音 攻克英语单词[J];现代阅读(教育版);2011年07期

2 满蓉;;浅议世界语及与英、汉比较[J];泸州职业教育技术学院学报;2003年02期

3 吉牧;;日语汉字音读与我国现代汉语读音的对应关系探究[J];黑龙江教育学院学报;2011年07期

4 罗实琴;;关于拼音教学的几点探索[J];群文天地;2011年08期

5 吴树奇;吴雨欣;;论汉语对英语学习的促进作用[J];教学与管理;2011年21期

6 张小樱;;用“拿来主义”进行小学低段语音教学[J];新课程(中);2011年07期

7 ;来稿须知[J];中国韵文学刊;2011年03期

8 绘丹;;难易之间[J];大众心理学;2003年10期

9 王婧;程芳;;马庆株教授做客湖南师范大学畅谈汉语汉字的过去、现在和未来[J];现代语文(语言研究版);2011年07期

10 郑鲁燕;;试论英汉语音对比中的近似与空缺[J];黑龙江教育学院学报;2011年06期

相关会议论文 前10条

1 王昭宁;;更充分地用汉语拼音——纪念《汉语拼音方案》公布五十周年[A];语文现代化论丛(第八辑)[C];2008年

2 黄东林;;汉语拼音拼写初探[A];语文现代化论丛(第八辑)[C];2008年

3 邬美丽;;汉语拼音使用的规范化[A];语文现代化论丛(第八辑)[C];2008年

4 孙茂松;;汉语自动分词研究及其应用:回顾与展望[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年

5 罗万;彭泽润;;汉语拼音及其词式书写自动处理[A];语文现代化论丛(第七辑)[C];2006年

6 孙茂松;;汉语自动分词研究的若干最新进展——清华大学相关工作简介[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年

7 曲维光;;解决汉语自动分词的方法选择[A];第一届学生计算语言学研讨会论文集[C];2002年

8 郭念锋;李晓雯;;对小学一、二年级学童汉语拼音和汉字组词联想的比较研究[A];全国第七届心理学学术会议文摘选集[C];1993年

9 陈晓;;中文文本自动分词研究述要[A];第四届全国语言文字应用学术研讨会论文集[C];2005年

10 贺前华;徐秉铮;;神经网络在汉语自动分词中的应用[A];第二届全国人机语音通讯学术会议论文集[C];1992年

相关重要报纸文章 前10条

1 王文平;运用儿童心理学理论浅析汉语拼音学习的必要性[N];语言文字周报;2005年

2 杜永道;汉语拼音中标点符号的用法[N];语言文字周报;2010年

3 本报记者 邹曦;周有光:汉语拼音之父[N];北京科技报;2009年

4 ;新加坡小学教汉语拼音出“问题”[N];世界报;2009年

5 本报记者 周逸敏;周有光:汉语拼音的缔造者[N];常州日报;2010年

6 黑龙江省语言文字工作委员会 孟广智;与时俱进开发汉语拼音功能[N];黑龙江日报;2008年

7 李平;汉语拼音的广泛用途[N];语言文字周报;2005年

8 卢兴翠;如何让学生轻松学习汉语拼音[N];黔西南日报;2010年

9 本报评论员;大力推行汉语拼音[N];人民日报;2003年

10 ;台决定改采汉语拼音[N];人民日报海外版;2008年

相关博士学位论文 前5条

1 贺前华;汉语自动分词及机器翻译研究[D];华南理工大学;1993年

2 杨瑞汉;义音汉字系统的创制[D];湖南师范大学;2009年

3 张英俊;对越汉字教学法研究[D];华中师范大学;2008年

4 郑飞艺;小学语文课程组织变革研究[D];华东师范大学;2009年

5 王立欣;翻译标准自动量化方法研究[D];上海外国语大学;2007年

相关硕士学位论文 前10条

1 罗万;基于生成性词库分词技术的汉语拼音自动转换研究[D];湖南师范大学;2009年

2 李丹;基于规则与统计的汉语自动分词研究[D];长春工业大学;2010年

3 赵欣;小学汉语拼音测试题库及评价量表的编制[D];华东师范大学;2011年

4 陈梅枚;《简明对外汉语拼音教材》的创编思路[D];暨南大学;2012年

5 曹丹;泰国零起点高中生汉语拼音教学实例探究[D];吉林大学;2012年

6 程晓静;自然语言处理在药物专利检索系统中的应用[D];大连理工大学;2004年

7 尚琳琳;汉语拼音中的无关言语效应[D];河北师范大学;2003年

8 纪飞;汉语字母词语规范问题研究[D];沈阳师范大学;2007年

9 罗小虎;基于蚁群算法的汉语自动分词的研究与实现[D];苏州大学;2004年

10 代建英;汉语自动分词系统的研究与实现[D];重庆大学;2005年



本文编号:2582413

资料下载
论文发表

本文链接:https://www.wllwen.com/jiaoyulunwen/duiwaihanyulunwen/2582413.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户bc35a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com