基于SVM的离合词词义消歧
本文关键词:基于SVM的离合词词义消歧
【摘要】:离合词词义消歧要解决如何让计算机理解离合词中的歧义词在具体上下文中的含义。针对离合词中歧义词在机器翻译中造成的对照翻译不准确以及在信息检索中无法匹配有效信息等问题,将词义消歧的方法应用于离合词中的歧义词,采用SVM模型建立分类器。为了提高离合词词义消歧的正确率,在提取特征时,结合离合词的特点,不仅提取了歧义词上下文中的局部词、局部词性、局部词及词性3类特征,还提取了"离"形式的歧义词的中间插入部分的特征;将文本特征转换为特征向量时,对布尔权重法进行了改进,依次固定某种类型特征权重,分别改变另外两种类型特征权重的消歧正确率来验证3类特征的消歧效果。实验结果表明,局部词特征、局部词及词性特征对消歧效果的影响高于局部词性特征,且采用不同类型的特征权重与采用相同的权重相比,消歧正确率提高了1.03%~5.69%。
【作者单位】: 河北大学计算机科学与技术学院;河北省机器学习与计算智能重点实验室;
【基金】:国家自然科学基金项目(61375075) 河北省自然科学基金项目(F2013201134,F2012201020) 保定市科学技术研究与发展指导计划项目(15ZR063)资助
【分类号】:TP391.1
【正文快照】: 1引言离合词是现代汉语中一种常见的特殊语言现象,其“可离可合”的特殊类型虽然保持了词义的整体性,却破坏了词结构的定型性[1]。随着信息检索、机器翻译等方面的需求迅猛增加,离合词词义研究成为离合词研究的热点。然而,离合词中歧义词又给这一热点问题的解决带来了许多困难
【参考文献】
中国期刊全文数据库 前1条
1 杨陟卓;黄河燕;;基于异构关系网络图的词义消歧研究[J];计算机研究与发展;2013年02期
【共引文献】
中国期刊全文数据库 前3条
1 杨威;杨陟卓;;大学云架构与大数据处理建模研究[J];中国教育信息化;2015年01期
2 杨陟卓;;基于上下文语境的词义消歧方法[J];计算机应用;2015年04期
3 闫蓉;高光来;;上下文边界可变的词义消歧[J];计算机工程与设计;2015年10期
中国硕士学位论文全文数据库 前2条
1 张瑞玲;教学资源自动文摘系统的研究与设计[D];北京交通大学;2014年
2 栾博;基于句法树的中文词义消歧方法研究[D];哈尔滨理工大学;2014年
【二级参考文献】
中国期刊全文数据库 前1条
1 刘鹏远;赵铁军;;基于双语词汇Web间接关联的无指导译文消歧[J];软件学报;2010年04期
【相似文献】
中国期刊全文数据库 前10条
1 吴云芳;;词义消歧相关术语简介[J];术语标准化与信息技术;2010年03期
2 金澎;;词义消歧和词义消歧评测简介[J];术语标准化与信息技术;2010年03期
3 于林林;魏琦;宋丽芳;;基于多种方法相融合的词义消歧的研究[J];电脑知识与技术;2010年33期
4 李生;张晶;赵铁军;姚建民;;词义消歧研究的现状与发展方向[J];计算机科学;2001年09期
5 郭池 ,陈家骏 ,王启祥;一种基于语料库的词义消歧策略[J];计算机工程与应用;2003年35期
6 全昌勤,何婷婷,姬东鸿,刘辉;基于指示词的词义消歧方法[J];计算机工程;2005年16期
7 全昌勤,何婷婷,姬东鸿,刘辉;从搭配知识获取最优种子的词义消歧方法[J];中文信息学报;2005年01期
8 全昌勤,何婷婷,姬东鸿,刘辉;基于义类的无导词义消歧方法的研究[J];计算机应用研究;2005年04期
9 胡蓉;词义消歧方法初探[J];洛阳工业高等专科学校学报;2005年01期
10 卢志茂;刘挺;李生;;统计词义消歧的研究进展[J];电子学报;2006年02期
中国重要会议论文全文数据库 前10条
1 曲维光;董宇;陈钟;陈小荷;;基于语境计算模型的词义消歧[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
2 郭宇航;车万翔;刘挺;;基于语言模型验证的词义消歧语料获取[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
3 于丽丽;丁德鑫;曲维光;陈小荷;石民;;基于多分类器集成的古代汉语词义消歧[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
4 张云涛;龚玲;王永成;;基于语料库的朴素贝叶斯方法的词义消歧[A];2005年中国智能自动化会议论文集[C];2005年
5 秦颖;王小捷;;组合中文词义消歧[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
6 王菁华;刘建毅;王枞;;语义网络结构下的词义消歧[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
7 张仰森;黄改娟;苏文杰;;基于隐最大熵原理的汉语词义消歧方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
8 丁江伟;刘挺;卢志茂;李生;;隐马尔可夫模型和贝叶斯模型词义消歧对比研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
9 赫兰光;王轩;李露;范士喜;;基于最大熵分类器的谓词识别与词义消歧[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
10 吴崇斌;张全;;上下文边界可变的贝叶斯分类器词义消歧方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 车超;知识自动获取的词义消歧方法[D];大连理工大学;2010年
2 陈俊鹏;词义消歧中若干关键技术研究[D];武汉大学;2012年
3 鹿文鹏;基于依存和领域知识的词义消歧方法研究[D];北京理工大学;2014年
4 王瑞琴;基于语义处理技术的信息检索模型研究[D];浙江大学;2009年
5 王菁华;文本中知识的获取[D];北京邮电大学;2008年
6 段建勇;多词表达抽取及其应用[D];上海交通大学;2007年
7 李辉;移动商务导购系统的研究[D];大连理工大学;2008年
8 涂锟;基于自然语言与记忆再重构的常识推理模型[D];华南理工大学;2010年
9 任飞亮;高适应性基于实例的机器翻译中关键技术研究[D];东北大学;2008年
10 刘宇鹏;机器翻译中系统融合技术的研究[D];哈尔滨工业大学;2011年
中国硕士学位论文全文数据库 前10条
1 孙继明;基于知网的汉语词义消歧研究[D];国防科学技术大学;2007年
2 但汉辉;一种汉语词义消歧方法的研究[D];重庆大学;2009年
3 孙广庆;基于语义范畴扩展的词义消歧的研究[D];哈尔滨工程大学;2008年
4 潘兆志;有监督方法在词义消歧中的应用[D];苏州大学;2009年
5 于林林;基于知网的汉语词义消歧方法的研究[D];沈阳航空工业学院;2008年
6 陈浩;基于二阶上下文的无导词义消歧研究[D];华中师范大学;2005年
7 全昌勤;基于语料库的汉语词义消歧方法研究[D];华中师范大学;2005年
8 闫蓉;基于语义的汉语词义消歧方法研究[D];西北大学;2006年
9 杨宇娜;基于统计的中文词义消歧技术研究[D];哈尔滨工业大学;2006年
10 商敏;汉语词义消歧研究[D];大连理工大学;2007年
,本文编号:1211634
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1211634.html