当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于搜索引擎的词汇语义相似度计算方法

发布时间:2017-08-23 16:03

  本文关键词:基于搜索引擎的词汇语义相似度计算方法


  更多相关文章: 语义相似度 信息检索 查询建议 网络检索


【摘要】:词汇语义相似度的计算在网页浏览和查询推荐等网络相关工作中起着重要的作用。传统的基于分类的方法不能处理持续出现的新词。由于网络数据中隐藏着大量的噪音和冗余,鲁棒性和准确性仍然是一个挑战,因此提出了一种基于搜索引擎的词汇语义相似度计算方法。语义片段和检索结果的页数被用来去除词汇语义相似度计算过程中的噪音和冗余。此外,还提出了一种方法来整合查询结果页数、语义片段和显示的搜索结果的数量,该方法不需要任何先验知识与本体。实验结果显示,所提出的方法在Rubenstein-Goodenough测试集的相关系数为0.851,优于现有的基于网络的词汇语义相似度计算方法,同时在搜索引擎的查询扩展任务中具有较为良好的应用效果。
【作者单位】: 华东政法大学计算机科学与技术系;
【关键词】语义相似度 信息检索 查询建议 网络检索
【基金】:国家社会科学基金项目(06BFX051) 上海高校选拔培养优秀青年教师科研专项基金(hzf05046)资助
【分类号】:TP391.1
【正文快照】: 1引言词汇语义相似度的研究在学术研究和应用中都是一个重要的问题。例如:词义消歧[1]、知识流构造[2-5]、图像检索[6]、自然语言处理[7]、主题检测[8]、查询推荐等[9]。近年来,随着网络的快速发展,在许多Web相关任务中词汇语义相似度的计算也越来越重要。在查询推荐方面[10],

【相似文献】

中国期刊全文数据库 前10条

1 蔡东风;白宇;于水;叶娜;任晓娜;;一种基于语境的词语相似度计算方法[J];中文信息学报;2010年03期

2 丁政建;张路;;一种改进的本体相似度计算方法[J];计算机工程;2010年24期

3 朱珍元;郑诚;;一种改进的本体相似度计算方法[J];微型机与应用;2011年01期

4 崔韬世;麦范金;;词语相似度计算方法分析[J];网络安全技术与应用;2012年05期

5 王国春;郑山红;赵辉;董亚则;;基于阶段递进的综合本体相似度计算方法[J];吉林大学学报(信息科学版);2014年02期

6 张忠平;田淑霞;刘洪强;;一种新的本体相似度计算方法[J];计算机应用研究;2008年10期

7 赵欢;李仁发;王家琴;张在美;;综合多层信息的本体概念相似度计算方法的研究[J];通信学报;2009年06期

8 李改;李章凤;李磊;;一种新的社会化相似度计算方法[J];计算机应用研究;2013年09期

9 曾辉;徐海洲;钟茂生;;基于主题和焦点的问句相似度计算方法[J];科学技术与工程;2014年06期

10 张忠平;田淑霞;刘洪强;;一种综合的本体相似度计算方法[J];计算机科学;2008年12期

中国重要会议论文全文数据库 前8条

1 白宇;于水;叶娜;蔡东风;任晓娜;;一种基于语境的词语相似度计算方法[A];第五届全国信息检索学术会议论文集[C];2009年

2 乔林;黄维通;孟威;;一种改进的知网系统词语相似度计算方法[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年

3 菅小艳;郑家恒;;一种改进的句子相似度计算方法[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年

4 卢延科;尹宝生;张桂平;苗雪雷;白宇;;基于伪LCS的中文专利句子相似度计算方法[A];第五届全国信息检索学术会议论文集[C];2009年

5 章志凌;虞立群;罗海飞;邵晓敏;;基于改进Corpus库的词语相似度计算方法[A];第二十四届中国控制会议论文集(下册)[C];2005年

6 章成志;李斌;;基于混合策略的查询串相似度计算方法[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年

7 陈希友;冯少荣;张东站;薛永生;;基于反馈的用户访问预测模型[A];第二十五届中国数据库学术会议论文集(一)[C];2008年

8 李天宁;肖桐;朱靖波;;科技论文的IPC自动标注[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

中国博士学位论文全文数据库 前2条

1 蔡圆媛;基于知识整合的词汇语义相似度计算方法研究[D];北京交通大学;2016年

2 吴小坤;轻量级服务推荐算法研究[D];北京邮电大学;2015年

中国硕士学位论文全文数据库 前10条

1 唐积益;推荐系统中相似度计算方法的研究[D];江苏科技大学;2015年

2 张广源;微博检索系统关键技术研究与实现[D];北京工业大学;2015年

3 尹路修;XML文档的聚类研究[D];湖南师范大学;2015年

4 邹能清;一种基于语义网络的中文文本相似度计算方法[D];湘潭大学;2015年

5 邬明强;基于分段融合的藏文文本相似度计算方法研究[D];西北民族大学;2016年

6 吕亚伟;食品安全网络舆情监测方法研究[D];北京化工大学;2016年

7 王璐;一种综合多层次信息的句子相似度计算方法研究[D];重庆大学;2016年

8 高鹏杨;基于多标签学习框架的微博文本分类研究[D];东南大学;2016年

9 万青云;并行LDA、聚类算法的研究及应用[D];南昌大学;2016年

10 陈欣;一种基于多属性本体的概念相似度计算方法的研究[D];东北师范大学;2010年



本文编号:725948

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/725948.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户25e60***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com