当前位置:主页 > 文艺论文 > 汉语言论文 >

汉语分词规范对《信息处理用现代蒙古语切分规范》建立的启示

发布时间:2018-04-15 11:01

  本文选题:分词规范 + 《蒙古语切分规范》 ; 参考:《广西社会科学》2011年10期


【摘要】:借鉴汉语分词规范,《信息处理用现代蒙古语切分规范》需遵循面向信息处理为主,面向语言学为辅,符合语言学理论,以人为本,定量及定性相结合等指导思想及科学性和严谨性、完整性、一致性、通用性等制订原则。其体例采用语法角度的分词法,切分范围包括14类基本词和10类非词单位。汉语分词规范概述部分的标点符号、习用语、缩略语、非汉字符号等内容,及具体说明部分的名词、数词等内容需加以深入研究;与《信息处理用现代蒙古语切分规范》有关的构词法可分为词法构词法、复合词缩略法、句法构词法、重叠法、仿叠法5种;蒙古语二字、三字复合词有多种类型,其切分比较复杂。
[Abstract]:Drawing lessons from the Chinese word segmentation norm, the modern Mongolian segmentation criterion for information processing should be oriented to information processing, supplemented by linguistics, in line with linguistic theory and people-oriented.Quantitative and qualitative guidelines and scientific and rigorous, integrity, consistency, versatility and other principles.The method of grammatical participle is used. The scope of segmentation includes 14 kinds of basic words and 10 kinds of non-word units.The punctuation mark, idiom, acronym, non-Chinese character symbol of the outline part of Chinese participle criterion, and the nouns and numerals of the specific description part need to be deeply studied.The word-formation related to the Modern Mongolian Segmentation Specification for Information processing can be divided into five categories: word formation, compound acronym, syntactic formation, overlap and repetition.Its segmentation is more complex.
【作者单位】: 中央民族大学;泉州师范学院;
【基金】:国家语委课题(MZ-115)
【分类号】:H212

【参考文献】

相关期刊论文 前7条

1 俞士汶,段慧明,朱学锋,孙斌;北京大学现代汉语语料库基本加工规范[J];中文信息学报;2002年05期

2 俞士汶,段慧明,朱学锋,孙斌;北京大学现代汉语语料库基本加工规范(续)[J];中文信息学报;2002年06期

3 孙茂松,王洪君,李行健,富丽,黄昌宁,陈松岑,谢自立,张卫国;《信息处理用词汇研究》九五项目结题汇报 信息处理用现代汉语分词词表[J];语言文字应用;2001年04期

4 王洪君;《信息处理用现代汉语分词词表》的内部构造和汉语的结构特点[J];语言文字应用;2001年04期

5 孙茂松,张磊;人机并存,“质”“量”合一,

本文编号:1753819


资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/hanyulw/1753819.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户af51d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com