面向普通未登录词识别和理解的二字词语义构词研究
本文关键词:面向普通未登录词识别和理解的二字词语义构词研究
【摘要】:近年来随着“词汇主义”思潮的兴起,词汇语义学成为中文信息处理的前沿课题之一。作为语言的子系统,词汇内部的特异性大,自身变动频繁,研究难度相对较大。与词相比,作为构词基本部件的词素在数量上相对有限,在表义功能上相对稳定,因此把词素作为基本资源,从语义上寻找他们组合成词的规律,用来辅助自然语言理解的思路受到了越来越多的关注。汉语自动分词是中文信息处理的基础环节。在基于词表的分词方法中,未登录词是影响分词精度最主要的因素之一,而未登录词中的普通新词,构成方式多种多样,功能变幻不定,数目不可穷尽,现有的基于统计的分词方法只能识别出高频词,对低频词的识别则有些无能为力。本文以《现代汉语词典》(第六版)中的二三字词作为选取范围,建立起现代汉语词素数据库,在此基础上选出50个高频词素,进而把含有这些词素的8984个二字词作为封闭考察对象。首先参照《现代汉语词典》(第六版),标注8984个二字词的词义,继而基于词义和知网(HowNet),标注前后词素的义项和对应义类,然后从意合结构、意根分布、意指方式、意变类型四个角度标注词素间的词化意义,最后综合词素意义和词化意义,在定量统计的基础上建立一个二字词的语义描写体系。二字词的语义描写体系主要包括8984个词的释义模式,词素-义类数据库,词素意义分布表,词化意义分布表和释义模式分布表。利用二字词的语义描写体系分别对《现代汉语词典》(第六版)新出现的1413个新词和取自论坛的自然语篇进行识别和理解,发现二字词的语义构词研究在普通未登录词的识别和理解中具有一定的应用价值。
【学位授予单位】:南京师范大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:H136
【共引文献】
中国期刊全文数据库 前10条
1 杨晓黎;;传承语素:汉语语素分析的新视角[J];安徽大学学报(哲学社会科学版);2012年02期
2 钱虹;;《现代汉语词典》联绵字研究[J];安徽农业大学学报(社会科学版);2009年03期
3 孙银新;;黎锦熙的汉语构词法研究及其贡献[J];安徽师范大学学报(人文社会科学版);2011年06期
4 朱建祥;;汉语词缀“性”及其英译[J];安徽工业大学学报(社会科学版);2008年01期
5 赵蕾;;对词义性质的一些思考[J];安徽文学(下半月);2007年03期
6 左杉;;现代汉语词和词汇的定义问题研究[J];安徽文学(下半月);2008年01期
7 赵艳平;“家”释义献疑[J];保定师范专科学校学报;2005年01期
8 张扬;;商标、广告标题用语中的外来词研究——由文化翻译到语言规范[J];宝鸡文理学院学报(社会科学版);2009年02期
9 王建军;;汉语双音节典故词色彩意义的演变[J];北方文学(下半月);2010年05期
10 董衡;;“海”与“洋”词义引申对比分析[J];北方文学(下半月);2012年01期
中国重要会议论文全文数据库 前6条
1 刘善涛;李敏;;基于信息库的新词词汇共性分析与教学策略研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 张晗;;英汉构词法对比研究[A];福建省外国语文学会2006年年会暨学术研讨会论文集(下)[C];2006年
3 张洪飞;;浅谈中日同形词——贩卖与“尒X颉盵A];福建省外国语文学会2006年年会暨学术研讨会论文集(下)[C];2006年
4 汪精华;;网络语言之英语借词的构建和传播特征[A];江西省语言学会2006年年会论文集[C];2006年
5 吴万和;;从中古汉语词汇语法现象看《列子》是托古伪书[A];江西省语言学会2007年年会论文集[C];2007年
6 董宪臣;;从网络词汇的衍生机制谈其对语言规范化的影响[A];语文现代化论丛(第八辑)[C];2008年
中国博士学位论文全文数据库 前10条
1 李颖玉;基于语料库的欧化翻译研究[D];上海外国语大学;2010年
2 王用源;汉语和藏语复音词构词比较研究[D];南开大学;2010年
3 方清明;现代汉语名名复合形式的认知语义研究[D];暨南大学;2011年
4 阮氏黎心;汉越人体名词隐喻对比研究[D];华东师范大学;2011年
5 赵宏;英汉词汇理据对比研究[D];华东师范大学;2011年
6 黄雪霞;新加坡华语词汇五十年发展变化研究[D];华中师范大学;2011年
7 王俊;现代汉语离合词研究[D];华中师范大学;2011年
8 任敏;现代汉语非受事动宾式双音复合词研究[D];河北师范大学;2011年
9 袁善来;比工仡佬语词汇研究[D];中央民族大学;2011年
10 吴玉凤(Nareerat Watthanawelu);明清华南竹枝词民俗文化词语与熟语研究[D];山东大学;2011年
中国硕士学位论文全文数据库 前10条
1 刘晓敬;试论茅盾《子夜》的语言艺术[D];河北大学;2007年
2 马晶晶;表人名词类词缀“X手”、“X者”、“X员”分析比较[D];辽宁师范大学;2010年
3 刘婧一;元代笔记分词理论与实践[D];广西师范学院;2010年
4 满蕾;东北方言数字词研究[D];广西师范学院;2010年
5 焦阳;现代汉语类词缀“坛”、“界”、“圈”比较研究[D];辽宁师范大学;2010年
6 刘洪伟;现代汉语词缀研究简论[D];青海师范大学;2010年
7 杨丽敏;反义动词的对称与不对称[D];青海师范大学;2010年
8 马丽;现代汉语外来词研究综述[D];东北师范大学;2010年
9 马福梅;“黄”与语素“黄”参构的词语:语义分析和修辞阐释[D];福建师范大学;2010年
10 林承亮;汉语颜色词“白”的修辞阐释[D];福建师范大学;2010年
,本文编号:1192828
本文链接:https://www.wllwen.com/wenyilunwen/yuyanxuelw/1192828.html