当前位置:主页 > 科技论文 > 搜索引擎论文 >

多实体间多样化关联的搜索方法研究

发布时间:2020-09-04 21:03
   实体关联搜索被应用于许多领域,比如国家安全和生物信息学等。近年来,网络中出现的图结构化的语义网数据促进了实体关联搜索的发展,这些数据提供了比那些隐藏在非结构化文本中的数据更为明确的结构化语义关联,便于计算机发现和处理。随着语义网数据数量的急剧增长,成千上万的语义关联产生。用户往往只想通过查看一些重要的、有价值的、包含尽可能多信息量的关联,来了解实体及其之间的关系。因此,需要进行多实体间top-k关联的搜索。多实体间top-k关联的搜索返回一个包含k个语义关联的列表,这k个关联有关于这个查询最大的打分和。实际上,top-k结果中的一些关联可能是相似的,它们显示了非常相近的语义,提供给用户冗余的信息。多实体间多样化top-k关联的搜索不仅仅考虑语义关联的打分,也考虑语义关联的多样性。为了进行多实体间多样化top-k关联的搜索,三个问题需要被解决。第一,如何度量语义关联的重要性,即如何对语义关联进行排序;第二,如何度量两个语义关联之间的相似度;第三,如何较快地搜索最优的多样化top-k语义关联。本文针对这些问题进行了探索,主要有以下两个方面的贡献:1.设计了一种多实体间关联排序的方法,排序原则是语义关联的结构大小和实体类型一致性,并基于该排序方法实现了一种多实体间top-k关联的搜索方法。2.实现了多种多实体间多样化top-k关联的搜索方法,提出一种综合考虑结构和语义的新方法来度量语义关联的相似性。
【学位单位】:南京大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:TP391.3
【部分图文】:

框架图,框架,实体,搜索方法


本文着重研宄多实体间多样化关联的搜索方法,依次从多实体间关联的排逡逑序、多实体间top-k关联的搜索、多实体间多样化top-k关联的搜索三部分逐步逡逑展开,本文框架如图1-4所示。本文有以下两方面的贡献:逡逑?设计了一种多实体间关联排序的方法,排序原则是语义关联的大小和实体逡逑类型的一致性,实现了一种多实体间top-k关联的搜索方法。用排序学习的逡逑方法验证现有八种排序方法的有效性,由此确定了排序原则并实现了多实逡逑体间top-k关联的搜索方法。逡逑?实现了多种多实体间多样化top-k关联的搜索方法,并用较为丰富的实验来逡逑评估这些方法。提出一种综合考虑结构和语义的新方法度量语义关联的相逡逑

关系图,语义关联,数据集中,方法


逦第二章预备知识和相关工作逡逑M1NG方法搜索得到的最优连通子图能够提供更多的信息量。图2-2显示了逡逑在YAGO数据集上,用MING方法对三个物理学家Niels邋Bohr、Max邋Planck和逡逑Albert邋Einstein进行语义关联搜索得到的最优结果。逡逑Quantum—physicis卜—工逦M0ritz_Sch||ck逡逑Theoretical_physicist逡逑-逦'逦-NobeLPrize邋<hasW0n、Albert_Einstein逡逑A邋Nobel_Laureate_in__physics邋**逡逑图2-2:在YAGO数据集中,用MING方法搜索得到的关于Niels邋Bohr、Max邋Planck和逡逑Albert邋Einstein的最优语义关联[13]逡逑SISP[12]的目标同样是在关系图中搜索一个规模受限的最优连通子图。与逡逑CEPS方法、M1NG方法的不同点在于,其顶点“优”的定义由两方面决定:第逡逑一,基于PageRank得到顶点自身的重要性;第二,顶点与查询实体之间的相逡逑关性,由顶点与查询实体对应的点之间的短路径来度量。基于这两点来评估搜逡逑索到的连通子图的质量,提出了邋PNR方法,使信息量的定义更可靠,返回的逡逑子图更令人满意。并实现了基于抽样的Sampling方法和基于粒子群优化算法逡逑(Particle邋Swarm邋Optimization,PSO)的SISP方法来快速搜索最优连通子图。SISP逡逑包含三个关键阶段。在初始化阶段

支持向量机,准确率,排序方法,分类算法


;C丨和;Cj*分别表示语义关联;c,.和七的用户打分。逡逑于是可以用现有的分类算法来训练模型,比如SVM算法,其目标分类函逡逑数为[V⑴-巧=如={±1},如图3-3所示。实验中使用了五种分类算法,对逡逑训练数据进行十折交叉验证。逡逑同时,为了判断3.1中每种排序方法是否有效,需要度量每个特征的重要逡逑程度,即每次删去一个特征,然后进行训练,观察准确率上升或者下降。如果逡逑准确率下降,说明这个特征在排序中是有效的,可以用到后续排序方法设计逡逑中。若准确率上升,说明这个特征在排序中无效,后续实验中不考虑该特征。逡逑

【相似文献】

相关期刊论文 前10条

1 瞿辉;王菲菲;;基于多维语义关联的学术文献展示方法研究[J];情报杂志;2015年11期

2 何伟;杨小平;;基于词间语义关联性的本体扩展[J];计算机应用与软件;2011年11期

3 胡金柱;舒江波;罗进军;;汉语复句中分句的语义关联特征[J];语言文字应用;2010年04期

4 车超;郑晓军;;基于语义关联图的词义消歧方法[J];科研信息化技术与应用;2014年04期

5 周伟;孙明;刘晚秋;谭振江;;基于云计算的满语数字资源语义关联模式研究[J];情报科学;2019年08期

6 杨现民;余胜泉;张芳;;学习资源动态语义关联的设计与实现[J];中国电化教育;2013年01期

7 李超;王兰成;;基于主题语义关联的扩展参照检索[J];情报理论与实践;2006年05期

8 金国栋;范炜;;卓越科学家数据语义关联与搜索发现研究[J];数字图书馆论坛;2014年04期

9 陈辰;王璐;郝晓雪;;基于词频统计与语义关联的京津冀协同发展研究热点与前沿监测研究[J];河北科技图苑;2018年01期

10 康廷虎;吴晨静;;情景间语义关系对语义关联判断的影响[J];心理与行为研究;2019年01期

相关会议论文 前10条

1 安延佩;许晓旭;王聪聪;唐卫海;;学习内容的语义关联程度对协作记忆中错误回忆的影响[A];中国心理学会发展心理专业委员会第十三届学术年会摘要集[C];2015年

2 古新生;顾学春;沈钧毅;;CIM—OSA DM CIMS环境下面向对象的语义关联数据模型[A];第九届全国数据库学术会议论文集(上)[C];1990年

3 袁兴宇;王挺;周会平;肖君;;以本体构造中文信息过滤中的需求模型[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年

4 万菁;姬东鸿;任函;冯文贺;;汉语复合名词短语特征结构的标注研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年

5 王慧媛;隋洁;;语义关联注意捕获的右视野优势——来自ERP的证据[A];心理学与创新能力提升——第十六届全国心理学学术会议论文集[C];2013年

6 宋t熝

本文编号:2812587


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2812587.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户45929***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com