基于图结构的多关键字检索研究
发布时间:2021-05-24 02:16
信息技术的发展极大地改变了人们获取资源的方式。其中,图上关键字查询技术引起了越来越多的关注。基于图结构的多关键字检索是在数据图上找到能够所有包含查询关键字的子图。很多文献都是返回子树的形式,如最小代价生成树。最近有研究也提出查找子图的算法,启发性算法就是其中的一种,但是它的查找过程是基于边的权重,而没有优先考虑节点和关键字之间的相似度,所以现有的算法并不能表现出两个节点之间最好的连接关系。同时,现有的方法在top-k结果的排序上也有一定的局限性,在计算边的权重时只是单纯的考虑两端节点的权重求平均,没有考虑每个查询关键字的影响,造成排序结果不理想。本文提出了一种新的图上多关键字检索方法,采用新的方式计算节点权重,并基于节点内容设计出一种搜索子图的算法,首先得到每个关键字对应的节点集合,然后根据节点的内容相关度依次选择节点加入结果集,最后计算结果边集的过程中考虑了hub节点的影响,克服了直接计算两两节点之间最短路径的弊端。最终试图返回结构关系更为紧密和无冗余的结果。本文同时提出一种新的计算方式来对每个结果子图进行打分排序,充分考虑了每个关键字对节点内容相关度的贡献,从而返回最优的top-k...
【文章来源】:南京邮电大学江苏省
【文章页数】:59 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究背景和意义
1.2 论文的主要工作
1.3 论文的结构安排
第二章 相关背景知识介绍
2.1 信息检索相关研究
2.1.1 TF-IDF算法
2.1.2 PageRank算法
2.1.3 HITS算法
2.2 关键字查询技术研究
2.2.1 xml文档关键字查询
2.2.2 关系数据库上关键字查询
2.2.3 图上关键字查询技术研究
第三章 基于节点内容的启发性搜索算法研究
3.1 问题描述
3.2 概念定义
3.3 算法描述
3.3.1 HMNC搜索算法
3.3.2 生成结果边集
3.4 本章小结
第四章 基于集合表示的排序算法研究
4.1 引言
4.2 问题描述
4.3 GSS排序算法
4.4 本章小结
第五章 实验与分析
5.1 实验数据
5.2 实验结果效率评价方法
5.3 评估实验结果的标准
5.3.1 DCG评估标准
5.3.2 NRR评价方法
5.4 本章小结
第六章 总结与展望
附录1 攻读硕士学位期间撰写的论文
附录2 攻读硕士学位期间申请的专利
附录3 攻读硕士学位期间参加的科研项目
致谢
参考文献
本文编号:3203374
【文章来源】:南京邮电大学江苏省
【文章页数】:59 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究背景和意义
1.2 论文的主要工作
1.3 论文的结构安排
第二章 相关背景知识介绍
2.1 信息检索相关研究
2.1.1 TF-IDF算法
2.1.2 PageRank算法
2.1.3 HITS算法
2.2 关键字查询技术研究
2.2.1 xml文档关键字查询
2.2.2 关系数据库上关键字查询
2.2.3 图上关键字查询技术研究
第三章 基于节点内容的启发性搜索算法研究
3.1 问题描述
3.2 概念定义
3.3 算法描述
3.3.1 HMNC搜索算法
3.3.2 生成结果边集
3.4 本章小结
第四章 基于集合表示的排序算法研究
4.1 引言
4.2 问题描述
4.3 GSS排序算法
4.4 本章小结
第五章 实验与分析
5.1 实验数据
5.2 实验结果效率评价方法
5.3 评估实验结果的标准
5.3.1 DCG评估标准
5.3.2 NRR评价方法
5.4 本章小结
第六章 总结与展望
附录1 攻读硕士学位期间撰写的论文
附录2 攻读硕士学位期间申请的专利
附录3 攻读硕士学位期间参加的科研项目
致谢
参考文献
本文编号:3203374
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3203374.html