当前位置:主页 > 文艺论文 > 汉语言论文 >

四万词的词法结构和语义结构分析

发布时间:2020-03-28 22:50
【摘要】:由于新词的不断涌现,一个信息处理用的词表,不管规模多大,都不可能囊括所有的词,总会有一些词不能被收录。要考察、分析并处理这些没有被收录的未登录词,是有一定的困难的。但是,如果我们穷尽了所有的构词模式,就可以将属于同一构词模式的未登录词与已登录词联系起来。新词虽然在数量上是无穷的,但构成新词的词素也是有限的,这样我们就可以利用已有的信息来识别和理解未登录词,并据此得出未登录词的词法结构和语义类信息。 本文对教育部公布的现代汉语常用词表(电子版)中近四万双音节词的构词方式和语义类别逐一进行了标注,统计并分析词素的素性、语义以及频率信息对整词的构词模式和词性的影响,以此为基础构建一部适合从语法和语义两个方面分析汉语的词汇知识库——《词法语义信息词典》。作者试图从大规模词语的内部结构着手,找到一个字串之所以为“词”的理由,为未登录词的识别和理解提供依据。 在实验过程中,我们发现,大部分词法结构构成的合成词的词性比较集中,例如定中式、述补式、述宾式、附加式、状中式以及量补式,同时,还有一部分词法结构构成的合成词的词性比较分散,例如重叠式、联合式、主谓式。各词法结构形成的合成词与词性之间没有必然的关系,但我们可加入词语的构词模式,帮助结构的判断,并结合最大概率法大致确定词法结构信息。语义类识别方面,我们采用词表驱动,参考同义词语义类信息投票,将获得票数最高的语义类视为待查词的语义类,也有较高的正确率
【学位授予单位】:南京师范大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:H146

【相似文献】

相关期刊论文 前10条

1 杜永道;无人物姓名时写人篇章首段的语义类型[J];汉语学习;1997年01期

2 郑珂,马青山;英汉颜色词的词法结构对比[J];湖北师范学院学报(哲学社会科学版);2002年02期

3 吕文华;“把”字句的语义类型[J];汉语学习;1994年04期

4 仲崇山;复合词构词方式的辨认[J];齐齐哈尔大学学报(哲学社会科学版);2002年03期

5 陈芳;;梧州藤县话词法结构[J];梧州学院学报;2009年02期

6 王智杰;;比况短语的分类[J];学术交流;2006年04期

7 杨建生;;浅谈基于形义关系的英语动词教学[J];长春理工大学学报(社会科学版);2010年05期

8 刘国辉;;英语教学中英语成语用法解析[J];吉林省教育学院学报;2010年12期

9 吾买尔·尼亚孜;;比较分析朝鲜语与维语尔语的词法结构[J];延边大学学报(社会科学版);2006年01期

10 裴志全;;从修辞角度看马丁·路德·金的演说《我们将走向哪里》[J];唐山师范学院学报;2009年04期

相关会议论文 前10条

1 贾玉祥;俞士汶;;语义选择限制的自动获取及其在隐喻处理中的应用[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年

2 王惠;苏新春;;XHK基于语法知识的汉语词义描述[A];第六届汉语词汇语义学研讨会论文集[C];2005年

3 王惠;;汉英机器翻译中基于大型语义词典的汉语词义消歧[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年

4 邱立坤;;现代汉语动名语串结构关系的判定[A];第六届汉语词汇语义学研讨会论文集[C];2005年

5 王萌;贾玉祥;俞士汶;;基于语料统计的量词对名词语义选择倾向的研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

6 海银花;那顺乌日图;;面向“蒙古语语义信息词典”的名词语义分类体系[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

7 吴平;;“NP+在+处所+VP”句式的逻辑语义分析[A];2004年逻辑研究专辑[C];2004年

8 李斌;曲维光;陈小荷;;名词转喻的自动理解[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

9 李向阳;张亚非;;一种基于语义的汉语短语识别方法[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年

10 高晓超;韩世辉;;语义与社会信息加工过程中视听交互作用的神经机制[A];第十一届全国心理学学术会议论文摘要集[C];2007年

相关博士学位论文 前10条

1 颜红菊;现代汉语复合词语义结构研究[D];首都师范大学;2007年

2 侯锋;中文报业出版的文字质量智能辅助控制技术研究[D];国防科学技术大学;2010年

3 曹海龙;基于词汇化统计模型的汉语句法分析研究[D];哈尔滨工业大学;2006年

4 荚济民;基于互联网数据集的图像标注技术研究[D];中国科学技术大学;2009年

5 王欣;类型逻辑语法与现代汉语“是”和“的”[D];北京语言大学;2009年

6 吴尉林;可移植的稳健口语理解方法研究[D];上海交通大学;2007年

7 凌坚;新闻视频主题识别与跟踪的研究[D];浙江大学;2007年

8 杨成虎;语法转喻的认知研究[D];北京师范大学;2008年

9 孟凯;现代汉语“X+N_(役事)”致使复合词研究[D];北京语言大学;2009年

10 李线宜;上海手语类标记结构调查研究[D];复旦大学;2010年

相关硕士学位论文 前10条

1 方利;“外X”词语的多角度考察[D];华中师范大学;2012年

2 韩娟;《韩非子》形容词研究[D];河南大学;2008年

3 陈文慧;HSK名词的图片可表达性和表达方法研究[D];北京语言大学;2004年

4 刘丽丽;汉英民用陆地交通工具词语语义对比研究[D];鲁东大学;2008年

5 沈新宇;基于直推式支持向量机的图像分类算法研究与应用[D];北京交通大学;2008年

6 刘宗保;形、名语素构成复合词的语义类组合分析[D];南京师范大学;2008年

7 刘蓉;违反合作原则的汉语语义类修辞格及其语用功能研究[D];湖南农业大学;2011年

8 高研博;汉语动词论元约束优选信息的获取[D];上海交通大学;2008年

9 贾晓东;汉语动宾搭配识别研究[D];大连理工大学;2008年

10 张涛;中文文本中未知词语的词义知识获取[D];山西大学;2005年



本文编号:2605020

资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/hanyulw/2605020.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f4459***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com