当前位置:主页 > 科技论文 > 软件论文 >

基于概念基元的词语相似度计算研究

发布时间:2018-05-13 05:33

  本文选题:词语相似度 + 语义距离 ; 参考:《电子与信息学报》2017年01期


【摘要】:词语相似度的计算在机器翻译、信息检索等多个领域有重要作用。该文以概念层次网络理论的概念基元符号系统为语义资源,在共性与差异性对比思想下,提出一个涵盖层次性、网络性、对比对偶特性、挂靠特性及五元组信息的多维度词语相似度计算方法;在节点深度和节点距离度量上,引入权重以增加不同层次间的区分程度。在人工打分的测试集上进行实验,结果表明该方法计算的相似度与人工判断的符合程度较好,兼容度、相关系数和序对符合度分别达到0.812,0.786和0.775;同时,相关性检验的结果也显示该方法的计算值与人工打分显著相关。
[Abstract]:Word similarity calculation plays an important role in machine translation, information retrieval and other fields. This paper takes the conceptual primitive symbol system of the conceptual hierarchy network theory as the semantic resource, under the thought of comparing the commonness and the difference, puts forward a kind of characteristic that covers hierarchy, network and contrast duality. The method of calculating the similarity of multi-dimension words based on link characteristics and five-tuple information, and introducing the weight in the measurement of node depth and node distance to increase the degree of distinction between different levels. Experiments were carried out on the test set of manual scoring. The results show that the similarity calculated by this method is in good agreement with manual judgment, and the degree of compatibility, correlation coefficient and sequence pair coincidence are 0.812 / 0. 786 and 0. 775, respectively. The results of correlation test also show that the calculated value of this method is significantly correlated with manual scoring.
【作者单位】: 中国科学院大学;中国科学院声学研究所;
【基金】:国家863计划“十二五”项目(2012AA011102) 国家语委“十二五”科研项目(YB125-53)~~
【分类号】:TP391.1

【参考文献】

相关期刊论文 前8条

1 李国佳;;基于知网的中文词语相似度计算[J];智能计算机与应用;2015年03期

2 李慧;;词语相似度算法研究综述[J];现代情报;2015年04期

3 孙晶;张东站;;基于逆概念频率的词语相似度计算[J];厦门大学学报(自然科学版);2015年02期

4 张沪寅;刘道波;温春艳;;基于《知网》的词语语义相似度改进算法研究[J];计算机工程;2015年02期

5 WANG Junhua;ZUO Wanli;PENG Tao;;Hyponymy Graph Model for Word Semantic Similarity Measurement[J];Chinese Journal of Electronics;2015年01期

6 吴佐衍;王宇;;基于HNC理论的词语相似度计算[J];中文信息学报;2014年02期

7 王桐;王磊;吴吉义;徐贺;;WordNet中的综合概念语义相似度计算方法[J];北京邮电大学学报;2013年02期

8 王石;曹存根;裴亚军;夏飞;;一种基于搭配的中文词汇语义相似度计算方法[J];中文信息学报;2013年01期

相关硕士学位论文 前1条

1 史燕;基于HNC的汉语句子相似度算法的研究[D];江苏大学;2009年

【共引文献】

相关期刊论文 前10条

1 池哲洁;张全;;基于概念基元的词语相似度计算研究[J];电子与信息学报;2017年01期

2 郑志蕴;阮春阳;李伦;李钝;;本体语义相似度自适应综合加权算法研究[J];计算机科学;2016年10期

3 索俊锋;刘勇;;基于农业本体的语义相似度算法及其在农作物本体中的应用[J];农业工程学报;2016年16期

4 苏依拉;窦保媛;吉亚图;;基于本体的蒙古语灾害信息检索模型[J];北京工业大学学报;2016年07期

5 盛艳梅;周子力;马淑丽;;基于CP加权的概念语义相似度算法[J];电子技术;2016年04期

6 王宇;伍力慧;;基于HNC理论的中文文本词汇链构造方法[J];情报杂志;2016年02期

7 刘健;张琨;陈旋;;基于标签和协同过滤的个性化推荐算法[J];计算机与现代化;2016年02期

8 刘一松;朱丹;;基于聚类与二分图匹配的语义Web服务发现[J];计算机工程;2016年02期

9 魏勇;胡丹露;郝晨光;欧小平;;基于分类关键词词频模型的地缘政治主题爬虫设计[J];计算机工程;2016年02期

10 韩兴邦;毛峡;;一种改进的词义相似度算法[J];中国科技论文;2016年02期

相关硕士学位论文 前7条

1 王莎;基于标签的模糊匹配微博人脉挖掘算法[D];湖南师范大学;2013年

2 柏雪;主观题自动阅卷系统的研究与设计[D];西南交通大学;2013年

3 林培金;基于领域本体的语义合成研究及应用[D];南京邮电大学;2013年

4 赵小谦;短文本指纹的研究[D];南京邮电大学;2012年

5 徐瑛;一种综合加权的词语语义相似度计算研究[D];青岛理工大学;2011年

6 李锦;仿射传播算法在中文词语聚类中的应用研究[D];昆明理工大学;2011年

7 江磊;领域词典的构建及其在语法分析中的应用[D];南京邮电大学;2011年

【二级参考文献】

相关期刊论文 前10条

1 王小林;杨林;王东;;基于知网的新词语相似度算法研究[J];情报科学;2015年02期

2 范弘屹;张仰森;;一种基于HowNet的词语语义相似度计算方法[J];北京信息科技大学学报(自然科学版);2014年04期

3 朱征宇;孙俊华;;改进的基于《知网》的词汇语义相似度计算[J];计算机应用;2013年08期

4 张敏;王振辉;王艳丽;;一种基于《知网》知识描述语言结构的词语相似度计算方法[J];计算机应用与软件;2013年07期

5 ;Call for Papers: Journal of Electronics (China)[J];Journal of Electronics(China);2013年03期

6 詹志建;梁丽娜;杨小平;;基于百度百科的词语相似度计算[J];计算机科学;2013年06期

7 游彬;严岳松;孙英阁;刘靖;;基于HowNet的信息量计算语义相似度算法[J];计算机系统应用;2013年01期

8 吕立辉;梁维薇;冉蜀阳;;基于词林的词语相似度的度量[J];现代计算机(专业版);2013年01期

9 刘萍;陈烨;;词汇相似度研究进展综述[J];现代图书情报技术;2012年Z1期

10 徐健;肖卓;;基于领域限定网络检索的术语相似度计算[J];情报理论与实践;2012年06期

相关硕士学位论文 前6条

1 南铉国;基于语句相似度计算的主观题自动评分技术研究[D];延边大学;2007年

2 张玉娟;基于《知网》的句子相似度计算的研究[D];中国地质大学(北京);2006年

3 肖雪莲;基于HNC理论的主观题自动批改算法设计与系统实现[D];华东师范大学;2006年

4 周舫;汉语句子相似度计算方法及其应用的研究[D];河南大学;2005年

5 朱毅华;智能搜索引擎中的同义词识别算法研究[D];南京农业大学;2001年

6 查贵庭;经济新闻自动标引系统的研究[D];南京农业大学;2000年

【相似文献】

相关期刊论文 前10条

1 王钧;赵曰利;;浙大中药指纹图谱相似度计算软件在烟用香精香料色谱分析中的引入应用[J];现代仪器;2007年03期

2 单建芳;刘宗田;周文;;事件相似度计算[J];小型微型计算机系统;2010年04期

3 刘文剑;郭宁;金天国;;制造资源本体的相似度计算模型[J];计算机集成制造系统;2010年11期

4 邸书灵;刘晓飞;李欢;;基于分词的语句相似度计算的改进[J];石家庄铁道大学学报(自然科学版);2011年04期

5 秦学勇;张润梅;;两级相似度计算在主观题机器阅卷中的应用[J];计算机工程;2012年11期

6 田卫东;强继朋;;基于问句类型的问句相似度计算[J];计算机应用研究;2014年04期

7 周凯波,冯珊,李锋;基于案例属性特征的相似度计算模型研究[J];武汉理工大学学报(信息与管理工程版);2003年01期

8 易丽萍,竹勇 ,雷小春;知网在词语相似度计算方面的应用[J];信息技术与信息化;2005年01期

9 廉站俊;吕学强;张玉杰;施水才;;基于句子相似度计算的信息抽取[J];现代图书情报技术;2007年06期

10 李伟;;中文语句相似度计算的方法初探[J];兰州工业高等专科学校学报;2009年04期

相关会议论文 前10条

1 刘磊;张桂平;蔡东风;季铎;;基于语义预测的双语术语相似度计算[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

2 郭丽;蔡东风;季铎;白宇;;统计与语义相融合的词语相似度计算[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年

3 吴志雄;;不精确数据的相似度计算[A];逻辑学及其应用研究——第四届全国逻辑系统、智能科学与信息科学学术会议论文集[C];2008年

4 王凯;李绍稳;张友华;刘超;;缺值背景中的粗糙形式概念相似度计算理论与方法[A];中国农业工程学会电气信息与自动化专业委员会、中国电机工程学会农村电气化分会科技与教育专委会2010年学术年会论文摘要[C];2010年

5 陈立;宋自林;郑世明;张英;;基于本体的概念相似度计算研究[A];江苏省系统工程学会第十一届学术年会论文集[C];2009年

6 车万翔;刘挺;秦兵;李生;;面向双语句对检索的汉语句子相似度计算[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年

7 郭文宏;范学峰;;基于语义词典和本体知识的概念相似度计算[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年

8 宋彦;张桂平;蔡东风;;基于N-gram的句子相似度计算技术[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年

9 关毅;王晓龙;王强;;论系统相似的度量[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年

10 林民;宋柔;;基于结构描述的汉字字形相似度计算[A];第三届学生计算语言学研讨会论文集[C];2006年

相关重要报纸文章 前1条

1 海量智能计算技术研究中心 霍刚;新兴技术为互联网加速[N];计算机世界;2007年

相关博士学位论文 前4条

1 冯晓文;基于GPU的相似度计算关键技术研究[D];华中科技大学;2014年

2 王秀红;文本相似度计算核函数的构造及其在分布式信息检索中的应用研究[D];江苏大学;2012年

3 刘磊;概念内涵属性计算研究[D];上海交通大学;2011年

4 任磊;推荐系统关键技术研究[D];华东师范大学;2012年

相关硕士学位论文 前10条

1 梁韬;中文微博新词与热点话题发现技术研究[D];湖南工业大学;2015年

2 汪建成;汉越双语新闻话题分析方法研究[D];昆明理工大学;2015年

3 唐海燕;基于全文的教育资源检索模型研究[D];四川师范大学;2015年

4 舒佳根;中文实体链接研究[D];苏州大学;2015年

5 孔行;基于主题推荐的辅助写作系统[D];哈尔滨工业大学;2015年

6 孙润志;基于语义理解的文本相似度计算研究与实现[D];中国科学院研究生院(沈阳计算技术研究所);2015年

7 刘敏;基于词向量的句子相似度计算及其在基于实例的机器翻译中的应用[D];北京理工大学;2015年

8 康毅;面向客服的自动问答系统关键技术研究[D];东北大学;2014年

9 吴宇浩;南海档案数字化半自动校勘中的底本推荐探讨[D];南京大学;2015年

10 吐尔逊阿依·阿不来提;小学维吾尔语文教材中的单句相似度研究[D];新疆师范大学;2015年



本文编号:1881891

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1881891.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户34d81***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com