当前位置:主页 > 科技论文 > 搜索引擎论文 >

搜索引擎的情报感知与刻画功能协同研究

发布时间:2021-09-24 19:24
  针对情报领域数据存在的收集、处理、感知、刻画困难等问题,提出了一种以知识图谱为刻画结果的搜索引擎,从而感知领域细微的变化态势;使用领域本体库进行知识抽取及挖掘,构建了领域知识图谱;采用基于知识图谱的分布式索引的动态构建、分布式倒排索引查询机制和智能排序算法等技术,构建了基于知识图谱的检索系统,改善了传统搜索引擎检索结果内容单一、召回率低的问题;实现了高效快速地提炼出可满足情报人员需要的、可理解的、可利用的资源,从而为企业决策者提供数据支持。 

【文章来源】:北京信息科技大学学报(自然科学版). 2019,34(06)

【文章页数】:6 页

【部分图文】:

搜索引擎的情报感知与刻画功能协同研究


系统整体设计框架

框架图,知识图,框架,实体


知识图谱是指通过构建实体、实体属性及实体之间的语义关系而形成的知识网络[2]。图2为构建知识图谱的整体框架。首先,通过一系列自动或半自动的技术对半结构化数据和非结构化数据进行实体、实体关系及属性信息抽取;然后,将抽取的知识与结构化数据及第三方数据进行实体消歧、共指消解,进行知识融合;最后,对融合后得到的新知识进行质量评估,将合格的数据保存到知识库中。整个构建过程是一个迭代更新的过程,核心分为信息抽取、知识融合及知识加工3个阶段。构建知识图谱,信息抽取是核心也是关键,利用领域本体库来判断抓取的数据是否是领域相关数据,并从数据中抽取出相关实体的知识碎片,最后将知识碎片进行融合形成领域知识。本文通过实验对比分析了5种知识抽取方法,如图3所示。

方法,知识图,实体,碎片


构建知识图谱,信息抽取是核心也是关键,利用领域本体库来判断抓取的数据是否是领域相关数据,并从数据中抽取出相关实体的知识碎片,最后将知识碎片进行融合形成领域知识。本文通过实验对比分析了5种知识抽取方法,如图3所示。从图3可看出基于本体库的知识抽取方法比传统的基于归纳学习[3-5]、基于自然语言处理[5]、基于视觉特征[6-8]和基于DOM树[9-10]的抽取方法更准确。本文通过本体库进行特征抽取得到的实体与实体间的关系以图4知识图谱的形式展示与存储,应用于搜索引擎,为搜索提供更全面更精准的检索结果。

【参考文献】:
期刊论文
[1]情报感知的研究解析[J]. 王延飞,赵柯然,陈美华,刘记.  情报理论与实践. 2018(08)
[2]一种倒排索引压缩方法[J]. 白福均,高建瓴,李宛蓉,贺思云,肖绍武.  计算机应用研究. 2019(01)
[3]Accessing Alignments of Ontologies via IoT Based on SKOS Data Model[J]. Xiulei Liu,Xia Hou,Junyang Yu,Ying Gao,Yue Zhang,Yingying Zhang.  中国通信. 2017(06)
[4]知识图谱构建技术综述[J]. 刘峤,李杨,段宏,刘瑶,秦志光.  计算机研究与发展. 2016(03)
[5]大数据环境下中小企业竞争情报系统模型构建[J]. 王洪亮,张琪,朱延涛.  情报理论与实践. 2015(07)
[6]大数据环境下的多源融合型竞争情报研究[J]. 化柏林,李广建.  情报理论与实践. 2015(04)
[7]基于改进TF-IDF算法的情报关键词提取方法[J]. 张瑾.  情报杂志. 2014(04)
[8]一种基于SVM和AdaBoost的Web实体信息抽取方法[J]. 孙明,陆春生,徐秀星,李庆忠,彭朝晖.  计算机应用与软件. 2013(04)
[9]大数据:企业竞争情报的机遇、挑战及对策研究[J]. 吴金红,张飞,鞠秀芳.  情报杂志. 2013(01)
[10]大数据时代企业竞争情报研究的创新与发展[J]. 黄晓斌,钟辉新.  图书与情报. 2012(06)

硕士论文
[1]基于知识图谱的搜索引擎技术研究与应用[D]. 邵领.电子科技大学 2016



本文编号:3408310

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3408310.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户09aec***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com