基于简单本体的农业P2P搜索引擎关键技术研究
发布时间:2021-11-29 02:14
随着互联网上资源爆炸式的增长,越来越多的网络用户依靠专门的检索工具,如Google、Yahoo!、Baidu等搜索引擎来查找自己所需的信息。这些站点在帮助用户快速找到所需信息的同时,也取得了巨大的商业成功。通常情况下,搜索引擎首先从数以百万计的网站中检索相关网页,并将它们存储在文件服务器中,然后通过分析这些下载页面来建立索引,搜索引擎使用生成的索引来定位网页中的所有查询关键字,并根据某些具体的相关函数返回最恰当的内容。从逻辑体系架构上分析,目前大型网络搜索引擎都是集中式的,而其检索的站点遍布世界每一个角落,拥有其自身的索引和查询处理机制,所以搜索引擎的扩展性、覆盖率、安全性和专业性等问题将是其在成功路上面临的巨大挑战。本文针对集中式搜索引擎存在的问题,利用基于P2P网络的分布式搜索引擎。即面向两种不同的拓扑结构——结构化P2P网络和非结构化P2P网络——分别采用了相应的检索方法,通过潜在语义索引对两种检索机制的结果进行聚类合并,论文同时将这几种关键技术应用到基于简单本体的农业搜索引擎系统中。具体而言,论文的研究内容主要包括:(1)论文以《农业科学叙词表》为基础,使用本体编辑器prote...
【文章来源】:沈阳农业大学辽宁省
【文章页数】:98 页
【学位级别】:博士
【文章目录】:
摘要
ABSTRACT
第一章 引言
1.1 研究背景及意义
1.1.1 集中式搜索引擎的现状
1.1.2 P2P网络
1.1.3 P2P搜索引擎
1.2 研究内容
1.2.1 网络的拓扑结构
1.2.2 农业本体的构建
1.2.3 基于简单本体的农业P2P搜索引擎框架
1.2.4 资源获取方法
1.2.5 检索结果的合并
1.3 研究成果
1.4 论文结构
第二章 农业本体构建
2.1 本体的概述
2.1.1 本体的概念
2.1.2 国内外研究状况
2.2 本体的相关技术
2.2.1 RDF和RDF Schema
2.2.2 OWL概述
2.3 本体的创建
2.3.1 本体构建工具
2.3.2 本体构建过程
2.4 本章小结
第三章 基于简单本体的农业P2P搜索引擎框架
3.1 基于简单本体的农业P2P搜索引擎的体系框架
3.1.1 拓扑结构
3.1.2 构建索引目录
3.2 基于简单农业本体索引的构建
3.2.1 索引数据结构
3.2.2 路由算法
3.3 语义的相似性判断方法
3.3.1 MPSS算法
3.3.2 实体问上下文的相似度
3.3.3 判断语义相似度的规则
3.3.4 检索结果的合并
3.4 实验与结果
3.4.1 JXTA
3.4.2 Lucene
3.4.3 试验结果分析
3.5 本章小结
第四章 基于结构化P2P网络的资源选择算法
4.1 相关工作
4.2 AIRPS采用的相关技术
4.2.1 向量空间模型
4.2.2 Chord
4.3 AIRPS方法概述
4.3.1 AIRPS结构
4.3.2 索引结构
4.4 AIRPS方法的操作过程
4.4.1 系统模式的构建
4.4.2 组的管理
4.4.3 索引管理
4.4.4 故障处理
4.5 方法评估
4.5.1 查询处理的效果
4.5.2 词索引的效率
4.5.3 网络规模变化的影响
4.5.4 更新周期变化的影响
4.5.5 实验结论
4.6 本章小结
第五章 基于非结构化P2P网络的资源选择算法
5.1 相关工作
5.2 相关技术
5.2.1 向量空间模型
5.2.2 布隆过滤器
5.3 系统设计
5.3.1 结点向量
5.3.2 拓扑自适应算法
5.3.3 检索协议
5.4 方法测试
5.4.1 测试数据
5.4.2 性能指标
5.4.3 仿真方法
5.4.4 结果分析
5.5 本章小结
第六章 检索结果的合并
6.1 相关研究成果
6.2 相关技术
6.2.1 文档索引
6.2.2 潜在语义索引
6.3 聚类算法
6.3.1 主要思想
6.3.2 动态SVD聚类算法
6.3.3 计算的复杂程度
6.4 实验及分析
6.4.1 数据集的说明
6.4.2 质量标准
6.4.3 索引方案
6.4.4 算法质量
6.4.5 计算时间
6.4.6 搜索引擎实例
6.5 本章小结
第七章 结论与展望
7.1 结论
7.2 展望
参考文献
致谢
攻读学位论文期间发表文章
【参考文献】:
期刊论文
[1]基于聚类算法的垂直搜索引擎技术研究[J]. 苗海,张仰森,岳明. 北京信息科技大学学报(自然科学版). 2013(01)
[2]开放存取资源的分布和利用研究——以农业类资源为例[J]. 王静君,陈长青. 新世纪图书馆. 2013(01)
[3]基于时空感知能力的农业信息搜索技术研究[J]. 王剑,王健,高秉博. 南方农业学报. 2013(01)
[4]中文搜索引擎商业模式比较:以百度和谷歌为例[J]. 王知津,潘颖. 图书馆工作与研究. 2012(11)
[5]基于P2P技术的分布式农业搜索引擎建设方法[J]. 郑文良,杨勇. 沈阳农业大学学报. 2012(05)
[6]基于对等结点指针表优化的Chord算法改进[J]. 张姗姗,成卫青,豆仁福. 计算机技术与发展. 2012(08)
[7]浅谈Lucene在号百搜索引擎系统中的集成[J]. 张建军,王剑霞. 科技资讯. 2012(21)
[8]P2P Web搜索中一种有效的查询路由策略[J]. 王振华,李妹芳,申德荣,于戈. 计算机与数字工程. 2011(10)
[9]基于本体的搜索引擎研究[J]. 王朝斌,金洪颖,赵刚. 西华师范大学学报(自然科学版). 2010(04)
[10]中文农业信息垂直搜索引擎的设计与实现[J]. 夏斌,丁立,乔红波,高瑞. 河南农业大学学报. 2010(06)
博士论文
[1]非合作性环境下的P2P搜索技术研究[D]. 任祖杰.浙江大学 2010
[2]基于网络编码的P2P文件分发的研究[D]. 马冠骏.中国科学技术大学 2009
[3]P2P网络拓扑结构研究[D]. 王向辉.哈尔滨工程大学 2008
[4]对等网络路由算法研究[D]. 段迅.贵州大学 2007
[5]本体理论及在农业文献检索系统中的应用研究——以花卉学本体建模为例[D]. 李景.中国科学院研究生院(文献情报中心) 2004
[6]基于P2P架构的网格文件系统研究[D]. 李庆虎.清华大学 2004
硕士论文
[1]基于多策略的Chord算法研究[D]. 王自洋.中北大学 2011
[2]基于Agent的网络信息检索[D]. 王芳芳.沈阳工业大学 2011
[3]软件过程中知识本体构建与应用[D]. 刘鹏程.山东经济学院 2010
[4]本体的构建及其在图书信息检索中的应用研究[D]. 周若静.大连海事大学 2009
[5]基于P2PSIP的安全机制的研究[D]. 张睿.西安电子科技大学 2009
[6]基于本体的垂直搜索引擎研究[D]. 王乐.西北大学 2008
[7]农业科学叙词表向农业本体转化系统的研究与实现[D]. 鲜国建.中国农业科学院 2008
[8]本体的构建及其在信息检索系统中的应用[D]. 陈志伟.华中师范大学 2008
[9]数字科技馆中文信息检索系统的设计与实现[D]. 王睿.山东大学 2007
[10]基于JXTA协议的层次性点对点搜索的查询路由机制研究[D]. 周青松.大连理工大学 2005
本文编号:3525631
【文章来源】:沈阳农业大学辽宁省
【文章页数】:98 页
【学位级别】:博士
【文章目录】:
摘要
ABSTRACT
第一章 引言
1.1 研究背景及意义
1.1.1 集中式搜索引擎的现状
1.1.2 P2P网络
1.1.3 P2P搜索引擎
1.2 研究内容
1.2.1 网络的拓扑结构
1.2.2 农业本体的构建
1.2.3 基于简单本体的农业P2P搜索引擎框架
1.2.4 资源获取方法
1.2.5 检索结果的合并
1.3 研究成果
1.4 论文结构
第二章 农业本体构建
2.1 本体的概述
2.1.1 本体的概念
2.1.2 国内外研究状况
2.2 本体的相关技术
2.2.1 RDF和RDF Schema
2.2.2 OWL概述
2.3 本体的创建
2.3.1 本体构建工具
2.3.2 本体构建过程
2.4 本章小结
第三章 基于简单本体的农业P2P搜索引擎框架
3.1 基于简单本体的农业P2P搜索引擎的体系框架
3.1.1 拓扑结构
3.1.2 构建索引目录
3.2 基于简单农业本体索引的构建
3.2.1 索引数据结构
3.2.2 路由算法
3.3 语义的相似性判断方法
3.3.1 MPSS算法
3.3.2 实体问上下文的相似度
3.3.3 判断语义相似度的规则
3.3.4 检索结果的合并
3.4 实验与结果
3.4.1 JXTA
3.4.2 Lucene
3.4.3 试验结果分析
3.5 本章小结
第四章 基于结构化P2P网络的资源选择算法
4.1 相关工作
4.2 AIRPS采用的相关技术
4.2.1 向量空间模型
4.2.2 Chord
4.3 AIRPS方法概述
4.3.1 AIRPS结构
4.3.2 索引结构
4.4 AIRPS方法的操作过程
4.4.1 系统模式的构建
4.4.2 组的管理
4.4.3 索引管理
4.4.4 故障处理
4.5 方法评估
4.5.1 查询处理的效果
4.5.2 词索引的效率
4.5.3 网络规模变化的影响
4.5.4 更新周期变化的影响
4.5.5 实验结论
4.6 本章小结
第五章 基于非结构化P2P网络的资源选择算法
5.1 相关工作
5.2 相关技术
5.2.1 向量空间模型
5.2.2 布隆过滤器
5.3 系统设计
5.3.1 结点向量
5.3.2 拓扑自适应算法
5.3.3 检索协议
5.4 方法测试
5.4.1 测试数据
5.4.2 性能指标
5.4.3 仿真方法
5.4.4 结果分析
5.5 本章小结
第六章 检索结果的合并
6.1 相关研究成果
6.2 相关技术
6.2.1 文档索引
6.2.2 潜在语义索引
6.3 聚类算法
6.3.1 主要思想
6.3.2 动态SVD聚类算法
6.3.3 计算的复杂程度
6.4 实验及分析
6.4.1 数据集的说明
6.4.2 质量标准
6.4.3 索引方案
6.4.4 算法质量
6.4.5 计算时间
6.4.6 搜索引擎实例
6.5 本章小结
第七章 结论与展望
7.1 结论
7.2 展望
参考文献
致谢
攻读学位论文期间发表文章
【参考文献】:
期刊论文
[1]基于聚类算法的垂直搜索引擎技术研究[J]. 苗海,张仰森,岳明. 北京信息科技大学学报(自然科学版). 2013(01)
[2]开放存取资源的分布和利用研究——以农业类资源为例[J]. 王静君,陈长青. 新世纪图书馆. 2013(01)
[3]基于时空感知能力的农业信息搜索技术研究[J]. 王剑,王健,高秉博. 南方农业学报. 2013(01)
[4]中文搜索引擎商业模式比较:以百度和谷歌为例[J]. 王知津,潘颖. 图书馆工作与研究. 2012(11)
[5]基于P2P技术的分布式农业搜索引擎建设方法[J]. 郑文良,杨勇. 沈阳农业大学学报. 2012(05)
[6]基于对等结点指针表优化的Chord算法改进[J]. 张姗姗,成卫青,豆仁福. 计算机技术与发展. 2012(08)
[7]浅谈Lucene在号百搜索引擎系统中的集成[J]. 张建军,王剑霞. 科技资讯. 2012(21)
[8]P2P Web搜索中一种有效的查询路由策略[J]. 王振华,李妹芳,申德荣,于戈. 计算机与数字工程. 2011(10)
[9]基于本体的搜索引擎研究[J]. 王朝斌,金洪颖,赵刚. 西华师范大学学报(自然科学版). 2010(04)
[10]中文农业信息垂直搜索引擎的设计与实现[J]. 夏斌,丁立,乔红波,高瑞. 河南农业大学学报. 2010(06)
博士论文
[1]非合作性环境下的P2P搜索技术研究[D]. 任祖杰.浙江大学 2010
[2]基于网络编码的P2P文件分发的研究[D]. 马冠骏.中国科学技术大学 2009
[3]P2P网络拓扑结构研究[D]. 王向辉.哈尔滨工程大学 2008
[4]对等网络路由算法研究[D]. 段迅.贵州大学 2007
[5]本体理论及在农业文献检索系统中的应用研究——以花卉学本体建模为例[D]. 李景.中国科学院研究生院(文献情报中心) 2004
[6]基于P2P架构的网格文件系统研究[D]. 李庆虎.清华大学 2004
硕士论文
[1]基于多策略的Chord算法研究[D]. 王自洋.中北大学 2011
[2]基于Agent的网络信息检索[D]. 王芳芳.沈阳工业大学 2011
[3]软件过程中知识本体构建与应用[D]. 刘鹏程.山东经济学院 2010
[4]本体的构建及其在图书信息检索中的应用研究[D]. 周若静.大连海事大学 2009
[5]基于P2PSIP的安全机制的研究[D]. 张睿.西安电子科技大学 2009
[6]基于本体的垂直搜索引擎研究[D]. 王乐.西北大学 2008
[7]农业科学叙词表向农业本体转化系统的研究与实现[D]. 鲜国建.中国农业科学院 2008
[8]本体的构建及其在信息检索系统中的应用[D]. 陈志伟.华中师范大学 2008
[9]数字科技馆中文信息检索系统的设计与实现[D]. 王睿.山东大学 2007
[10]基于JXTA协议的层次性点对点搜索的查询路由机制研究[D]. 周青松.大连理工大学 2005
本文编号:3525631
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3525631.html