当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于结构化数据的搜索引擎

发布时间:2021-09-04 12:33
  [目的/意义]搜索引擎作为互联网的核心技术与应用之一,代表了互联网发展的水平。了解当前搜索引擎的发展情况,有利于更好地把握技术前沿动态。[方法/过程]文章首先阐述搜索引擎的发展历史,然后重点介绍基于结构化数据的搜索引擎的原理、应用场景,揭示这一类搜索引擎的特征。[结果/结论]基于数据的搜索引擎是互联网发展过程中的必然结果,也是互联网发展的一个亮点。搜索引擎会继续将互联网的精英技术和理念收揽其中,在人们的学习、生活中发挥更加突出的作用。 

【文章来源】:现代情报. 2019,39(02)CSSCI

【文章页数】:7 页

【部分图文】:

基于结构化数据的搜索引擎


Swoogle检索界面

网络图,搜索引擎,检索结果,知识图


LD、RDF/XML、Turtle等格式返回。SPARQL是一种功能强大的查询语言,允许应用程序对RDF数据库进行复杂的查询。但是它毕竟是一种面向底层的查询语言,普通用户掌握起来有很大的困难。因此,最开始的RDF搜索引擎存在搜索界面不友好、结果显示界面信息不丰富和欠美观的情况,并未走入寻常百姓家。图2RDF搜索引擎检索结果[5]随着语义网的发展,RDF数据库越来越多,人们希望能够充分发挥RDF三元组精准描述的特性,因此,逐渐出现了一些能够提供基于半自然语言提问的问答型搜索引擎(QuestionandAnswerSearchEngine)。2.3知识图谱(KnowledgeGraph)与谷歌、必应作为互联网搜索引擎巨头,谷歌不断推出新的理念、标准和产品。2012年5月,谷歌发布“知识图谱(KnowledgeGraph,KG)”,并且将知识图谱加入到谷歌搜索中。知识图谱的概念来自于上世纪60年代,知识图谱的本质是描述真实世界中存在的各种实体或概念及其关系的网络图。它能够极大改进搜索引擎的效率和效果,为智能应用奠定基础。知识实体的建设是基于数据搜索引擎的基石。实体又被称作概念(Concept)、事物(Thing)或知识元。知识实体的数量、准确性以及详细程度决定搜索引器服务质量的基础。谷歌知识图谱的实体信息内容丰富,包括且不限于CIA的世界概况,Freebase和维基百科[6]等。2012年谷歌知识图谱已经包含了超过5.70亿个经常被搜索的人、地名和事物[7]。它服务的方式类似于维基百科(Wikipedia)的InfoBox,在搜索结果页面的右边栏,加上了针对关键词的一些结构化描述内容。与谷?

搜索引擎,农产品附加值,提问方式,肉类产品


UERIX为例,它在用户的提问方式上进行了一些限制,要求用户要以特定的词汇开始提问,例如What、Which、HowMany、GiveMe等等。接收到用户的输入后,搜索引擎首先会对语句进行结构分析、语词依赖性分析、实体识别,力图“理解”用户的真实意图,再转换为内部检索指令。以DBpedia的SPARQLEndpoint服务为例,如果我们要从维基百科中查询“有哪些人出生在柏林”,转换成SPAR-QL语句就是:“select?pwhere{?pdbpprop:birth-Place"Berlin"@en.}”。图3QUERIX用户检索界面笔者认为,当前最为杰出的问答型搜索引擎是由沃尔夫勒姆研究公司(WolframResearch)开发的WolframAlpha搜索引擎。有人认为,WolframAl-pha其实是一个计算知识引擎,而不是搜索引擎。例如,如果想了解美国主要农产品的信息,只需要输入:WhatAretheMainAgriculturalProductsofU.S.,WolframAlpha给出的答案由以下几部分组成:美国12种主要农产品的名称、美国农业基本信息片段,包括2015年的农产品附加值;主要农产品类型、年度耕地面积以及气候类型、主要肉类产品2006年的产量、主要畜牧种群特定年份的数量。图4是其中的2个部分:图4WolframAlpha检索结果[13]—07—2019年2月第39卷第2期现代情报JournalofModernInformationFeb.,2019Vol.39No.2


本文编号:3383272

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3383272.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户25db1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com