当前位置:主页 > 文艺论文 > 语言艺术论文 >

蒙古文文本词汇自动对比技术研究

发布时间:2018-04-24 02:43

  本文选题:语料库 + 语料库分析软件 ; 参考:《内蒙古大学》2017年硕士论文


【摘要】:近几年,语料库语言学正在迅速的发展,许多学者意识到语料库语言学的跨学科应用前景,尤其是给当今的文学评论领域带来了大规模的佐证材料。运用大规模语料库、词汇统计和句法分析工具进行文本处理对文学分析或评论提供了可靠的数据。基于语料库的蒙古文文学研究,也是一个新的探索领域。随着蒙古文信息处理工作的深入发展,其涉及面、应用领域也在不断拓展,如果说十年前人们主要将这一技术用于语言学研究,那么近年来其涉及面已扩展到文学、历史、民俗等多个领域。文学与语言学的相辅相成开拓了许多研究领域,如诗歌、小说和戏剧等。语料库语言学的迅速发展,给当今的文学评论带来了新的途径。语料库语言学中的语料标注、词汇分析等方法为文学作品的分析提供了可靠的文本信息,也使得当今文论家可以摒弃费时费力的人工劳动,精准便捷的检索、统计和分析,为文学分析和批论提供可信可靠的文本信息。本文所涉及的文学作品是在文学评论界被人们进行比较的热点作品,本文主要介绍了自建的蒙古文文学语料库并使用语料库分析软件对比分析其词汇特征,再使用自编的程序匹配出熟语语料和短语语料,再从中人工筛选出复合词,最后构建熟语语料库和复合词语料库。
[Abstract]:In recent years, Corpus Linguistics is developing rapidly. Many scholars have realized the prospect of cross-disciplinary application of Corpus Linguistics, especially in the field of literary criticism. The use of large-scale corpus, lexical statistics and syntactic analysis tools for text processing provides reliable data for literary analysis or comment. The study of Mongolian literature based on corpus is also a new exploration field. With the further development of Mongolian information processing, its scope and application fields are also expanding. If people mainly used this technology in linguistic research ten years ago, it has been extended to literature and history in recent years. Folklore, etc. Literature and linguistics complement each other in many fields of study, such as poetry, fiction and drama. The rapid development of corpus linguistics has brought a new way to literary criticism. Corpora tagging, lexical analysis and other methods provide reliable text information for the analysis of literary works, and also enable contemporary literary theorists to abandon time-consuming and laborious labor, accurate and convenient retrieval, statistics and analysis. To provide credible and reliable text information for literary analysis and criticism. The literary works involved in this paper are hot ones compared by people in literary criticism. This paper mainly introduces the self-built Mongolian literature corpus and uses corpus analysis software to compare and analyze its lexical features. Then the idiom corpus and phrase corpus are matched by using the self-compiled program, and then the compound words are manually selected from them. Finally, the idiom corpus and the compound word corpus are constructed.
【学位授予单位】:内蒙古大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:H212

【相似文献】

相关期刊论文 前10条

1 孙彦;;大型工具书《中国蒙古文古籍总目》正式出版[J];文献;2000年03期

2 华沙宝;蒙古文网络信息技术处理的对策[J];民族语文;2002年06期

3 白云莉;;蒙古文整词输入法的设计与实现[J];内蒙古农业大学学报(自然科学版);2008年03期

4 哈森其木格;;《蒙古文论发展概论》评析[J];内蒙古民族大学学报(社会科学版);2011年03期

5 乌日娜;;清代蒙古文历史文献及其整理研究概况[J];兰台世界;2011年19期

6 包力高;;蒙古文[J];民族语文;1980年02期

7 黄时鉴;;罗依果著《孝经的古蒙古文译本》简介[J];蒙古学资料与情报;1984年02期

8 斯钦朝克图;;蒙古文信息处理已进入标准化[J];民族语文;1986年05期

9 吴肃民;关照宏;;蒙古文古籍种种[J];中国民族;1987年05期

10 昂如布;包力高;;关于改进蒙古文的探讨[J];蒙古学资料与情报;1987年01期

相关会议论文 前10条

1 包艳花;图格木勒;;多字体印刷蒙古文识别后处理研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年

2 吉仁尼格;;蒙古文同形词的统计法[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年

3 呼斯勒;六月;斯日古楞;;浅谈蒙古文通用编辑器几点基本规范[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年

4 道布;;回鹘式蒙古文[A];中国民族古文字[C];1982年

5 道布;;回鹘式蒙古文研究概况[A];中国民族古文字研究[C];1980年

6 白双成;胡其图;木仁;;蒙古文音节切分算法实现及其应用[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年

7 孟和吉雅;白音门德;敖其尔;田会利;;蒙古文语音合成技术研究[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年

8 孟和吉雅;敖其尔;巩政;;蒙古文网页制作技术分析[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年

9 确精扎布;;蒙古文编码国际标准通过以后研制的几种蒙古文录入系统比较[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年

10 宝金良;;蒙古文文本标点符号及其属性字段设置[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年

相关重要报纸文章 前10条

1 记者 吉儒木图;手机可以使用蒙古文了[N];内蒙古日报(汉);2007年

2 记者 解太荣;《蒙古秘史》回鹘体蒙古文复原项目完成[N];锡林郭勒日报;2009年

3 孟克;如何打破蒙古文图书产销两难的困境[N];中国民族报;2010年

4 记者 阿斯钢;蒙古国总统签命令推广回鹘式蒙古文[N];新华每日电讯;2010年

5 记者 苏布达;全盟首届蒙古文图书节落幕[N];锡林郭勒日报(汉);2012年

6 陈岗龙 (蒙古族);蒙古文文学翻译的两个问题[N];文艺报;2013年

7 金坛;蒙古文:描绘大自然的千姿百态[N];中国民族报;2014年

8 阿勒得尔图;沙日布却玛:用回鹘体蒙古文还原《蒙古秘史》[N];中国民族报;2006年

9 记者 张文强;蒙古文图书农牧民阅读大接力活动启动[N];内蒙古日报(汉);2008年

10 徐恒泰;要全力抓好蒙古文教学资源建设[N];鄂尔多斯日报;2008年

相关博士学位论文 前9条

1 苏向东;基于深度学习和知识策略的蒙古文古籍识别研究[D];内蒙古大学;2016年

2 巴图额尔敦;文本资源检索技术在西里尔蒙古文远程教育系统中的应用研究[D];内蒙古大学;2017年

3 淑琴;蒙古文同形词知识库的构建[D];内蒙古大学;2010年

4 达古拉;《清内秘书院蒙古文档案汇编》语言研究[D];内蒙古大学;2012年

5 魏宏喜;蒙古文古籍图像检索技术研究[D];内蒙古大学;2012年

6 通拉嘎;基于蒙古文语料库的人名自动识别[D];中央民族大学;2013年

7 莎日娜;乌兰巴托版蒙古文译本《今古奇观》研究[D];中国社会科学院研究生院;2010年

8 王桂荣;蒙古文字结构研究[D];内蒙古大学;2011年

9 普日布苏荣;蒙古语语料库建设的有关问题[D];内蒙古大学;2015年

相关硕士学位论文 前10条

1 关高娃;蒙古文停用词和英文停用词比较研究[D];内蒙古大学;2011年

2 常红梅;衮布扎布语言论著中的蒙古文阿里嘎礼研究[D];内蒙古大学;2013年

3 刘璐;面向蒙古文增量g┱沟男畔⒓焖骷际跹芯縖D];内蒙古大学;2015年

4 李坤;蒙古文网络热点词提取算法研究[D];内蒙古大学;2015年

5 王洪伟;基于规则和统计的西里尔与传统蒙古文相互转换方法研究[D];内蒙古大学;2015年

6 张畔;蒙古文搜索引擎基本方法的实现[D];内蒙古大学;2015年

7 宋莉;蒙古文字造形元数据的分类编号探讨[D];内蒙古农业大学;2015年

8 青玉;指导小学生蒙古文正字法教学探析[D];内蒙古师范大学;2015年

9 达拉夫;文献学视角下的蒙古文古籍研究[D];内蒙古大学;2015年

10 王亚君;基于Linux IBUS的传统蒙古文输入法的研究与实现[D];内蒙古师范大学;2015年



本文编号:1794803

资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/yuyanyishu/1794803.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户69f1b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com