当前位置:主页 > 科技论文 > 搜索引擎论文 >

科技论文的语义搜索研究

发布时间:2019-03-17 19:59
【摘要】:近年来,科技论文作为前沿知识的载体呈指数级增长,因此,如何高效的检索到准确的电子科技论文已成为一个不可忽视的研究问题。论文检索一般是借助于搜索引擎进行的,搜索方式可以概括为两种:基于关键词匹配的搜索和基于语义的搜索。传统的基于关键词匹配的搜索,简单方便,却忽视了关键词之间的关系和隐含语义,检索时容易忽略一些相关却不包含关键词的科技论文。基于语义的搜索亦提出了很多年,使用语义搜索,可以提高检索的效率和准确度,但却需要熟知本体、实体、概念以及相应的知识表示等语义知识,复杂困难,所以目前语义搜索的使用大部分还停留在研究阶段。因此,如何将科技论文的关键词搜索无缝且高效的衔接到语义搜索上,方便用户直接使用关键词就可以享受到语义搜索的效果,这就是本文研究的重点。本文将科技论文的搜索过程分为三个部分:搜索关键词,搜索论文文档,关键词到论文文档的映射,并以这三点为突破点,实现操作简单的科技论文的语义搜索。本文提出一种基于关键词的语义搜索方式,此搜索的实现分为三步:(1)为搜索提供准确的搜索关键词;(2)结构化搜索论文文档;(3)实现搜索关键词到论文文档的高效映射。实现的难点有三个:(1)关键词的二义性:关键词具有同义词和多义词,如何获得用户输入的关键词所表达的真正含义是一难点。(2)科技论文的语义模型:不同用户对同一科技论文的关注部分是不同的,如何准确的划分并标注出科技论文的语义模块亦是重点。(3)关键词和科技论文的语义匹配:关键词没有属性且具有歧义性,这会造成大量的检索结果,如何提取关键词的隐含语义,并实现其和科技论文的语义匹配,挑选出最符合用户需求的检索结果也是急需解决的难点。为解决以上三个难点,本文针对其提出的科技论文语义搜索方式,主要分为三个方面:(1)关键词的相关概念推荐:为解决关键词的二义性,本文提出CRBK(Concepts Recommendation Based on Keywords)模型,此模型基于输入的关键词,为用户推荐与关键词相关的概念,不仅帮助用户找出其最想表达的含义,而且提示用户有更多相关方向的概念词可以选择。(2)科技论文语义模型和自动标注:本文提出BPSR(Background,Research problem,Solution,Result)语义模型,将科技文论文的摘要分为以上四个语义模块,并将其自动标注出来,此模型准确提取出论文中用户需要的知识,提高了用户挑选和阅读论文的效率。(3)基于语义标签的关键词和科技论文的匹配:基于Wikidata这一开放知识库的内容及结构,提出将关键词和科技论文映射为语义标签,并基于此进行匹配和论文排序,此匹配方式提取出了关键词的隐含语义,提高了论文的查全率。本文通过以上三点实现了科技论文的语义搜索。实验结果表明,与传统的基于关键词的搜索方法相比,本文提出的科技论文的语义搜索模型,提高了科技论文搜索的查准率和查全率,也证明基于简单的关键词亦可以实现复杂的语义搜索,这对语义搜索的普及与推广具有重大意义。此外,本文分析了目前提出的语义搜索模型的不足之处,并进一步讨论了本语义模型改进的可能性和优化的方式。
[Abstract]:......
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.3

【相似文献】

相关期刊论文 前10条

1 文坤梅;卢正鼎;孙小林;李瑞轩;;语义搜索研究综述[J];计算机科学;2008年05期

2 耿瑞峰;钱雪忠;;基于元数据的语义搜索技术研究[J];微计算机信息;2005年26期

3 王勇;;触摸语义搜索的脉搏[J];软件世界;2009年10期

4 苏明明;宋文;;基于本体的语义搜索引擎解决方案研究新进展[J];现代图书情报技术;2008年11期

5 孙静宇;余雪丽;李鲜花;;面向语义搜索的推荐模型研究[J];广西师范大学学报(自然科学版);2008年03期

6 刘幺和;李巧云;;基于语义搜索的语音交互系统模型研究[J];计算机应用;2009年07期

7 陈响亮;李怀松;梁意文;;基于语义搜索的实名呼叫系统设计[J];计算机与现代化;2011年09期

8 杨克特;陈华钧;;面向特定领域的语义搜索结果排序算法[J];计算机应用与软件;2011年12期

9 马雷雷;梁汝鹏;连世伟;陈虎;;一种主题本体驱动的语义搜索方法[J];地理空间信息;2013年04期

10 于彤;陈华钧;李敬华;;面向中药新药研发的语义搜索系统[J];中国医学创新;2013年33期

相关重要报纸文章 前7条

1 高爽;语义搜索正从概念转向应用[N];人民邮电;2014年

2 本报记者 张志乾 实习生 张利冰;中华英才网举办创新技术体验日活动 筹划全平台升级[N];中国贸易报;2012年

3 CUBN记者 邓丽娟;大数据时代亟需技术革新[N];中国联合商报;2012年

4 行云;骆捚和他的技术“三剑客”[N];中华工商时报;2012年

5 苗得雨;语义搜索PK关键词搜索[N];电脑报;2008年

6 本报记者 郭平;EMC应对IT五项刚性需求[N];计算机世界;2008年

7 本报记者 王星;应用搜索进化论[N];电脑报;2013年

相关博士学位论文 前5条

1 黎明;云计算资源管理关键技术研究[D];电子科技大学;2015年

2 文坤梅;基于本体知识库推理的语义搜索研究[D];华中科技大学;2007年

3 朱海平;基于概念图匹配的语义搜索[D];上海交通大学;2006年

4 吴定峰;基于本体的语义搜索模型研究[D];中国农业科学院;2012年

5 陈毅波;基于关联数据和用户本体的个性化知识服务关键技术研究[D];武汉大学;2012年

相关硕士学位论文 前10条

1 何擎昊;基于SWRL规则的个性化语义搜索方法的研究与实现[D];华南理工大学;2015年

2 朱晋超;科技论文的语义搜索研究[D];吉林大学;2017年

3 高杰旺;基于三维分类模型语义搜索的设计与实现[D];电子科技大学;2011年

4 兰,

本文编号:2442648


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2442648.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d9bcb***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com