融合《知网》和搜索引擎的词汇语义相似度计算
本文选题:语义相似度 切入点:知网 出处:《计算机应用》2017年04期 论文类型:期刊论文
【摘要】:针对当前《知网》的词语语义描述与人们对词汇的主观认知之间存在诸多不匹配的问题,在充分利用丰富的网络知识的背景下,提出了一种融合《知网》和搜索引擎的词汇语义相似度计算方法。首先,考虑了词语与词语义原之间的包含关系,利用改进的概念相似度计算方法得到初步的词语语义相似度结果;然后,利用基于搜索引擎的相关性双重检测算法和点互信息法得出进一步的语义相似度结果;最后,设计了拟合函数并利用批量梯度下降法学习权值参数,融合前两步的相似度计算结果。实验结果表明,与单纯的基于《知网》和基于搜索引擎的改进方法相比,融合方法的斯皮尔曼系数和皮尔逊系数均提升了5%,同时提升了具体词语义描述与人们对词汇的主观认知之间的匹配度,验证了将网络知识背景融入到概念相似度计算方法中能有效提高中文词汇语义相似度的计算性能。
[Abstract]:In view of the mismatch between the semantic description of the words and the subjective cognition of the words in the current Web of knowledge, under the background of making full use of the abundant knowledge of the network, there are many mismatches between the semantic description of the words and the subjective cognition of the words. In this paper, a method for calculating semantic similarity of words is proposed. Firstly, the inclusion relationship between words and semantic elements is considered. The improved concept similarity calculation method is used to obtain the preliminary semantic similarity results. Then, the search engine based correlation double detection algorithm and the point mutual information method are used to obtain the further semantic similarity results. Finally, The fitting function is designed and the weight parameters are studied by the batch gradient descent method, and the results of similarity calculation of the first two steps are fused. The experimental results show that compared with the improved methods based on knowledge net and search engine, The Spelman coefficient and Pearson coefficient of the fusion method were increased by 5, and the matching degree between the semantic description of specific words and the subjective cognition of the words was improved. It is verified that the integration of the network knowledge background into the conceptual similarity calculation method can effectively improve the computational performance of semantic similarity of Chinese vocabulary.
【作者单位】: 南华大学计算机科学与技术学院;
【基金】:国家自然科学基金资助项目(61402220,61502221) 湖南省教育厅科研项目(16C1378,14B153,15C1186) 湖南省哲学社会科学基金资助项目(14YBA335)~~
【分类号】:TP391.3
【相似文献】
相关期刊论文 前10条
1 王钧;赵曰利;;浙大中药指纹图谱相似度计算软件在烟用香精香料色谱分析中的引入应用[J];现代仪器;2007年03期
2 单建芳;刘宗田;周文;;事件相似度计算[J];小型微型计算机系统;2010年04期
3 刘文剑;郭宁;金天国;;制造资源本体的相似度计算模型[J];计算机集成制造系统;2010年11期
4 邸书灵;刘晓飞;李欢;;基于分词的语句相似度计算的改进[J];石家庄铁道大学学报(自然科学版);2011年04期
5 秦学勇;张润梅;;两级相似度计算在主观题机器阅卷中的应用[J];计算机工程;2012年11期
6 田卫东;强继朋;;基于问句类型的问句相似度计算[J];计算机应用研究;2014年04期
7 周凯波,冯珊,李锋;基于案例属性特征的相似度计算模型研究[J];武汉理工大学学报(信息与管理工程版);2003年01期
8 易丽萍,竹勇 ,雷小春;知网在词语相似度计算方面的应用[J];信息技术与信息化;2005年01期
9 廉站俊;吕学强;张玉杰;施水才;;基于句子相似度计算的信息抽取[J];现代图书情报技术;2007年06期
10 李伟;;中文语句相似度计算的方法初探[J];兰州工业高等专科学校学报;2009年04期
相关会议论文 前10条
1 刘磊;张桂平;蔡东风;季铎;;基于语义预测的双语术语相似度计算[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
2 郭丽;蔡东风;季铎;白宇;;统计与语义相融合的词语相似度计算[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
3 吴志雄;;不精确数据的相似度计算[A];逻辑学及其应用研究——第四届全国逻辑系统、智能科学与信息科学学术会议论文集[C];2008年
4 王凯;李绍稳;张友华;刘超;;缺值背景中的粗糙形式概念相似度计算理论与方法[A];中国农业工程学会电气信息与自动化专业委员会、中国电机工程学会农村电气化分会科技与教育专委会2010年学术年会论文摘要[C];2010年
5 陈立;宋自林;郑世明;张英;;基于本体的概念相似度计算研究[A];江苏省系统工程学会第十一届学术年会论文集[C];2009年
6 车万翔;刘挺;秦兵;李生;;面向双语句对检索的汉语句子相似度计算[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
7 郭文宏;范学峰;;基于语义词典和本体知识的概念相似度计算[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
8 宋彦;张桂平;蔡东风;;基于N-gram的句子相似度计算技术[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
9 关毅;王晓龙;王强;;论系统相似的度量[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
10 林民;宋柔;;基于结构描述的汉字字形相似度计算[A];第三届学生计算语言学研讨会论文集[C];2006年
相关重要报纸文章 前1条
1 海量智能计算技术研究中心 霍刚;新兴技术为互联网加速[N];计算机世界;2007年
相关博士学位论文 前4条
1 冯晓文;基于GPU的相似度计算关键技术研究[D];华中科技大学;2014年
2 王秀红;文本相似度计算核函数的构造及其在分布式信息检索中的应用研究[D];江苏大学;2012年
3 刘磊;概念内涵属性计算研究[D];上海交通大学;2011年
4 任磊;推荐系统关键技术研究[D];华东师范大学;2012年
相关硕士学位论文 前10条
1 梁韬;中文微博新词与热点话题发现技术研究[D];湖南工业大学;2015年
2 汪建成;汉越双语新闻话题分析方法研究[D];昆明理工大学;2015年
3 唐海燕;基于全文的教育资源检索模型研究[D];四川师范大学;2015年
4 舒佳根;中文实体链接研究[D];苏州大学;2015年
5 孔行;基于主题推荐的辅助写作系统[D];哈尔滨工业大学;2015年
6 孙润志;基于语义理解的文本相似度计算研究与实现[D];中国科学院研究生院(沈阳计算技术研究所);2015年
7 刘敏;基于词向量的句子相似度计算及其在基于实例的机器翻译中的应用[D];北京理工大学;2015年
8 康毅;面向客服的自动问答系统关键技术研究[D];东北大学;2014年
9 吴宇浩;南海档案数字化半自动校勘中的底本推荐探讨[D];南京大学;2015年
10 吐尔逊阿依·阿不来提;小学维吾尔语文教材中的单句相似度研究[D];新疆师范大学;2015年
,本文编号:1646559
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1646559.html