当前位置:主页 > 科技论文 > 信息工程论文 >

P2P系统中的信息检索理论及应用研究

发布时间:2016-11-05 19:36

  本文关键词:P2P系统中的信息检索理论及应用研究,由笔耕文化传播整理发布。


《山东师范大学》 2011年

P2P系统中的信息检索理论及应用研究

郭磊  

【摘要】:P2P系统中的信息检索理论是当前学术界研究的热点问题,随着互联网络技术的发展,网络资源日趋丰富,基于对等网络技术实现对这些资源的组织和管理不但可以作为对传统搜索引擎的有益补充,而且为实现大规模分布式检索提供了一种有效的解决方案。论文分析了影响P2P系统中实现信息检索技术的若干因素,从网络拓扑结构、网络性能分析、资源排序算法以及系统实现这四个方面进行重点研究。经过三年的研究,在阅读大量文献的基础上,取得了一定的研究成果。针对网络拓扑结构,提出一种基于多主题的网络模型构建算法,该算法依据资源类型进行主题划分,能够迅速搜集到网络中的资源信息,可作为信息检索系统的网络组织结构;针对网络性能分析,使用PeerSim模拟器搭建网络平台,从节点利用率、节点数量、自我恢复能力等方面对多主题网络进行性能分析,可为信息检索系统的性能研究提供方法上的借鉴;针对资源排序算法,提出一种基于节点负载的Top-k排序算法,该算法可以有效解决因节点动态性强而引起的传输质量下降的问题;针对系统实现,设计并实现了一个校园环境下的信息检索系统原型,该系统可作为信息检索理论应用的一部分。 本文的主要研究内容包括以下几个部分: 首先,提出一种基于多主题的网络模型构建算法。针对对等网络中节点自治性强、全局信息缺失的重要问题,提出一种能有效搜集资源全局信息的算法。该算法依据资源的类型将其划分为多个主题,通过周期性的发现算法将具有相同主题的资源信息聚集在一起,形成多个按主题划分的社区,并根据节点能力形成若干个超级节点,进而形成一种具有层次结构的网络模型。由于社区内聚集了网络中同一主题的资源信息,对于特定的查询,只需由超级节点路由到相应的主题社区,就可获得相对较优的检索结果。 其次,使用PeerSim模拟器对主题网络模型进行性能分析。对等网络一般具有节点众多,不易搭建真实网络环境的特点,利用网络模拟器对网络结构进行模拟是研究对等网络的重要方法之一。论文选择PeerSim模拟器搭建网络平台,将多主题网络分别与单主题和无主题网络结构进行对比,实验结果表明,该模型不仅能够搜集到近似全局的节点信息,而且具有较快的收敛速度和较强的鲁棒性。 接着,提出一种基于节点负载的Top-k排序算法。由于对等网络中节点动态性较强,没有集中控制机制,节点本身及其所处的网络状态不断发生变化,节点间的数据传输质量得不到保证,为此论文研究基于节点负载的排序算法。对网络中节点的负载及网络状况进行预测,将网络负载情况引入到结果的排序算法中。通过与相关算法进行比较,对算法的有效性进行验证,实验结果表明,引入节点负载的资源排序算法,能够有效地提高传输效率和服务质量。 最后,设计并实现了一种校园网环境下基于主题划分的信息检索系统。针对校园网环境下信息检索、资源共享问题,设计了一种基于主题划分的实现方案,该方案考虑到校园网资源按照学科、部门分布的特点,将其按照学科、适用对象等进行主题划分,将用户搜索限制在主题相关的子网内。该方案采用对等结构作为资源组织方式,集资源检索、共享、管理功能于一体,能够有效地对校园网资源进行管理。

【关键词】:
【学位授予单位】:山东师范大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP393.02
【目录】:

  • 摘要6-8
  • ABSTRACT8-10
  • 第一章 绪论10-14
  • 1.1 研究背景10-11
  • 1.1.1 研究目的及意义10
  • 1.1.2 问题描述10-11
  • 1.2 主要工作11-12
  • 1.3 论文组织结构12-14
  • 第二章 相关领域研究现状14-25
  • 2.1 对等网络简介14-19
  • 2.1.1 对等网络的定义14
  • 2.1.2 对等网络的发展历史14-17
  • 2.1.3 对等网络的基本特征17-19
  • 2.2 对等网络的应用现状19-20
  • 2.3 对等网络中的资源定位机制20-23
  • 2.3.1 非结构化网络20-22
  • 2.3.2 结构化网络22-23
  • 2.3.3 半分布式网络23
  • 2.4 对等网络中的信息检索研究现状23-24
  • 2.4.1 结构化网络23-24
  • 2.4.2 非结构化网络24
  • 2.5 本章小结24-25
  • 第三章 一种基于多主题的网络模型构建算法25-33
  • 3.1 引言25
  • 3.2 相关研究25-26
  • 3.3 网络模型26-27
  • 3.4 关键算法27-29
  • 3.4.1 GOSSIP 协议27
  • 3.4.2 NEWSCAST 算法27-28
  • 3.4.3 超级节点选择算法28-29
  • 3.5 实验环境及参数29
  • 3.6 实验结果分析29-32
  • 3.7 本章小结32-33
  • 第四章 一种基于节点负载的TOP-K 排序算法33-42
  • 4.1 引言33
  • 4.2 相关研究33-34
  • 4.3 算法描述34-40
  • 4.3.1 基本概念34-36
  • 4.3.2 网络模型及查询机制36-37
  • 4.3.3 算法实现过程37-40
  • 4.4 实验分析40-41
  • 4.5 本章小结41-42
  • 第五章 信息检索系统的设计与实现42-54
  • 5.1 引言42-43
  • 5.2 系统整体架构43-45
  • 5.2.1 系统体系结构43-44
  • 5.2.2 节点结构44-45
  • 5.3 系统总体设计45-49
  • 5.4 功能实现49-53
  • 5.4.1 资源发布模块49-50
  • 5.4.2 资源检索模块50-51
  • 5.4.3 资源传输模块51-52
  • 5.4.4 资源管理模块52-53
  • 5.5 本章小结53-54
  • 第六章 结束语54-56
  • 6.1 本文的主要工作总结54
  • 6.2 进一步的工作54-56
  • 参考文献56-61
  • 攻读硕士学位期间发表的学术论文61-62
  • 致谢62
  • 下载全文 更多同类文献

    CAJ全文下载

    (如何获取全文? 欢迎:购买知网充值卡、在线充值、在线咨询)

    CAJViewer阅读器支持CAJ、PDF文件格式


    【参考文献】

    中国期刊全文数据库 前10条

    1 马跃,王金霞,刘晓冰;基于Lotus Notes科研院所办公自动化系统[J];大连理工大学学报;2002年05期

    2 王湛昱;孙名松;邸明星;;基于改进CAN的查找算法[J];哈尔滨工业大学学报;2010年07期

    3 周金洋;杨寿保;郭磊涛;王菁;;Gnutella环境下基于兴趣和信任的资源发现算法[J];华中科技大学学报(自然科学版);2006年S1期

    4 程学旗,吕建明,周昭涛;基于对等网络的全文信息检索[J];计算机研究与发展;2004年12期

    5 杨丹;徐传运;文俊浩;;基于主题相关的P2P网络研究[J];计算机科学;2007年08期

    6 凌波;周水庚;周傲英;;P2P信息检索系统的查询结果排序与合并策略[J];计算机学报;2007年03期

    7 王晓宇,熊方,凌波,周傲英;一种基于相似度分析的主题提取和发现算法[J];软件学报;2003年09期

    8 何盈捷,王珊,杜小勇;纯Peer to Peer环境下有效的Top-k查询[J];软件学报;2005年04期

    9 杨智;朱君;代亚非;;Peer-to-Peer存储系统中一种高效的数据维护方案[J];软件学报;2009年01期

    10 任浩;王劲林;尤佳莉;;一种高效的对等网络流媒体数据调度算法[J];西安交通大学学报;2011年06期

    中国博士学位论文全文数据库 前3条

    1 杨舰;对等网络有效搜索机制研究[D];复旦大学;2004年

    2 吴宇;对等网络内容搜索及索引缓存研究[D];中国科学院研究生院(计算技术研究所);2006年

    3 韩定一;对等网络的社区模型及其在搜索中的应用[D];上海交通大学;2007年

    中国硕士学位论文全文数据库 前1条

    1 刘保言;对等(P2P)网络搜索技术的研究[D];重庆大学;2004年

    【共引文献】

    中国期刊全文数据库 前10条

    1 陈文;基于决策树的入侵检测的实现[J];安徽技术师范学院学报;2005年05期

    2 景晓军;赵伟;;浅谈基于JXTA的P2P应用开发[J];信息安全与技术;2011年07期

    3 彭莉芬;陈俊生;胡学钢;;基于粗糙集决策树算法的研究[J];安庆师范学院学报(自然科学版);2012年01期

    4 赵玉鹏;;论机器学习[J];安阳工学院学报;2011年04期

    5 孙雪;李昆仑;胡夕坤;赵瑞;;基于半监督K-means的K值全局寻优算法[J];北京交通大学学报;2009年06期

    6 赵勇;刘凯;;数字挖掘方法在遥感分类中的应用研究[J];北京测绘;2009年03期

    7 沈奕,滑峰,刘椿年;基于GDT的对FOIL系统的改进[J];北京工业大学学报;2005年02期

    8 朱青;刘宇辉;;一种面向领域的组件质量度量算法[J];北京工业大学学报;2007年01期

    9 陈阳舟;黄旭;代桂平;;基于新的状态划分的多机器人围捕策略[J];北京工业大学学报;2010年08期

    10 陈爽;陈福;杜天苍;;一种启发式网络信息采集系统设计与实现[J];北京石油化工学院学报;2007年04期

    中国重要会议论文全文数据库 前10条

    1 张敏;陆向艳;周敏;潘林琳;农冬冬;王彬彬;陈晓江;;数据挖掘在智能题库系统中的应用[A];广西计算机学会2004年学术年会论文集[C];2004年

    2 杨大超;张育平;;基于移动Agent的JXTA资源搜索的研究[A];2008通信理论与技术新发展——第十三届全国青年通信学术会议论文集(下)[C];2008年

    3 马玉莲;王宇冬;王鑫;;基于解释的分类算法[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年

    4 杜琳;石慧;刘晓平;;一种基于Q学习的任务调度算法的改进研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年

    5 刘莉;肖诗斌;王涛;施水才;;基于RSS的分布式博客搜索引擎设计[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

    6 孙宏纲;陆余良;;基于二元切分的互联网新闻主题词自动提取研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

    7 吴佳金;杨志豪;林原;林鸿飞;;基于改进Pairwise损失函数的排序学习方法[A];第六届全国信息检索学术会议论文集[C];2010年

    8 水超;贾焰;邹鹏;周斌;;一种P2P环境下高效Topk资源搜索技术[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年

    9 刘汝佳;孙增圻;;RoboCup救援仿真组中火势蔓延的DBN模型[A];2007年足球机器人大会论文集[C];2007年

    10 冯旭祥;王万玉;张宝全;;遥感卫星接收系统的故障诊断技术综述[A];中国空间科学学会空间探测专业委员会第二十六届全国空间探测学术研讨会会议论文集[C];2013年

    中国博士学位论文全文数据库 前10条

    1 全惠敏;电能质量相关信号的S变换检测算法及应用研究[D];湖南大学;2010年

    2 高山;蛋白质点突变效果预测与突变数据库研究[D];南开大学;2010年

    3 曹葵康;支持向量机加速方法及应用研究[D];浙江大学;2010年

    4 林龙信;仿生水下机器人的增强学习控制方法研究[D];国防科学技术大学;2010年

    5 杜伟;机器学习及数据挖掘在生物信息学中的应用研究[D];吉林大学;2011年

    6 聂黎;基于基因表达式编程的车间动态调度方法研究[D];华中科技大学;2011年

    7 杨抒;基于WEB的林产品信息资源整合方法研究[D];北京林业大学;2011年

    8 黎方正;关系数据库的关键词检索技术研究[D];中南大学;2010年

    9 黄静华;支持向量机算法研究及在气象数据挖掘中的应用[D];中国矿业大学(北京);2011年

    10 陈俊;笑脸表情分类识别的研究[D];华南理工大学;2011年

    中国硕士学位论文全文数据库 前10条

    1 左宗乐;多移动Agent动态协作在P2P文件共享中的应用研究[D];安徽工程大学;2010年

    2 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年

    3 韩晓峰;高斯混合模型及在探测网络社区结构中的应用[D];山东科技大学;2010年

    4 杨勇;基于SOA的浙江永康某小家电企业应用系统集成平台开发与应用[D];浙江理工大学;2010年

    5 王利明;一种基于PMIPv6的智能辅助高效切换方案[D];郑州大学;2010年

    6 左维松;规则和统计相结合的篇章情感倾向性分析研究[D];郑州大学;2010年

    7 许坤;基于本体的应急信息管理系统的研究与设计[D];郑州大学;2010年

    8 侯垚森;基于消息延迟预测的自适应失效检测模型研究[D];郑州大学;2010年

    9 吴迪;高校毕业生就业推荐系统的设计与开发[D];大连理工大学;2010年

    10 汪艳丽;无结构P2P环境下文件副本管理研究[D];大连理工大学;2010年

    【二级参考文献】

    中国期刊全文数据库 前10条

    1 冯峰,王小刚;OAS中的工作流设计方法[J];计算机工程与应用;2000年03期

    2 寿志勤;基于Lotus Notes的工作流软件设计[J];计算机工程与应用;2000年08期

    3 陈姝,方滨兴,周勇林;P2P技术的研究与应用[J];计算机工程与应用;2002年13期

    4 黄道颖,李祖鹏,庄雷,黄建华,张安琳;分布式Peer-to-Peer网络Gnutella模型研究[J];计算机工程与应用;2003年05期

    5 李祖鹏,黄道颖,庄雷,黄建华,刘彩霞;基于Peer-to-Peer网络的JXTA技术研究[J];计算机工程与应用;2003年11期

    6 张联峰,刘乃安,钱秀槟,张玉清;综述:对等网(P2P)技术[J];计算机工程与应用;2003年12期

    7 黄道颖,陈新,张安琳,张尧,黄建华;P2P网络Gnutella模型中搜索消息的路由机制及改进研究[J];计算机工程与应用;2003年25期

    8 刘鹏;都志辉;李三立;陈渝;朱子玉;黄震春;顾雷;;保障QoS的P2P分布式VOD系统的设计[J];计算机科学;2002年09期

    9 彭小燕;杨寿保;陈东锋;;MCAN:一种可扩展改进的内容访问网络[J];计算机科学;2004年11期

    10 陈洪,刘双与,杨玉华;P2P技术发展与应用[J];计算机工程;2003年19期

    中国博士学位论文全文数据库 前1条

    1 杨舰;对等网络有效搜索机制研究[D];复旦大学;2004年

    中国硕士学位论文全文数据库 前2条

    1 胡罡;Ad Hoc路由协议的仿真及优化技术[D];国防科学技术大学;2004年

    2 邵一峰;结构化对等网络中负载平衡技术研究[D];上海交通大学;2007年

    【相似文献】

    中国期刊全文数据库 前10条

    1 肖燕;20世纪我国信息检索研究的历史回顾[J];图书馆学研究;1999年06期

    2 叶鹰,马景娣,黄晨,朱聪,胡晓珍,刘琼;信息检索网上自助教学探索[J];大学图书馆学报;2000年02期

    3 李慧敏,方敏,张雪梅;高校信息检索教育课教学改革构想[J];山东图书馆季刊;2001年02期

    4 吴良凯;大学生信息检索教育的现状与对策[J];图书馆论坛;2003年05期

    5 罗映红;基于网络的信息检索与信息检索能力的培养[J];高校图书馆工作;2004年02期

    6 李其港;对高职信息检索课程教学改革的构思[J];职教论坛;2004年23期

    7 李宙星;;浅析互联网信息超载[J];中国西部科技;2004年16期

    8 陈璐;;亚马逊网络书店的信息检索[J];图书馆研究与工作;2004年04期

    9 赖俊;周琳;张学平;;基于Web挖掘的主题式搜索引擎的设计[J];军事通信技术;2004年03期

    10 王雅戈;Openfind搜索引擎功能解析[J];江西图书馆学刊;2005年02期

    中国重要会议论文全文数据库 前10条

    1 孙金立;李路路;王栋;;生物信息检索教学网的建设[A];向数字化转型的图书馆工作[C];2004年

    2 姚树宇;赵少东;;一种使用分布式技术的搜索引擎[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年

    3 孙金立;李路路;董明强;;建立生物信息检索教学网的研究[A];中华医学会第十次全国医学信息学术会议论文汇编[C];2004年

    4 ;编者的话[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年

    5 米晓红;;一种基于LSI的用户兴趣模型构建方法[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年

    6 王敬成;;HNC农村智能信息检索系统[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年

    7 李应兴;付婷;李勇;;基于LUCENE的藏文信息检索的研究与应用[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年

    8 于志刚;杨金生;;农业机械网络书签[A];第十三次全国农机维修学术会议论文集[C];2007年

    9 ;前言[A];第四届全国信息检索与内容安全学术会议论文集(下)[C];2008年

    10 田田;马军;李跃军;;应用多本体进行信息检索的研究[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年

    中国重要报纸全文数据库 前10条

    1 希安;[N];经济日报;2004年

    2 叶静;[N];人民邮电;2001年

    3 本报记者 潘永花;[N];网络世界;2003年

    4 刘静一;[N];建筑报;2000年

    5 刘光强;[N];中国计算机报;2007年

    6 柏荣;[N];中国高新技术产业导报;2003年

    7 刘立新;[N];学习时报;2006年

    8 常燕杰;[N];中国计算机报;2006年

    9 微软中国研究院 陈正 李明镜 马维英;[N];计算机世界;2001年

    10 夏飞平 蒋光君;[N];中国国门时报;2009年

    中国博士学位论文全文数据库 前10条

    1 王彪;信息检索中信息需求域的研究[D];内蒙古大学;2012年

    2 左家莉;信息检索中Markov网络图模型研究[D];江西财经大学;2011年

    3 吴定峰;基于本体的语义搜索模型研究[D];中国农业科学院;2012年

    4 董道国;高维数据索引结构研究[D];复旦大学;2005年

    5 林建方;词搭配抽取及在信息检索中的应用研究[D];哈尔滨工业大学;2010年

    6 翟海军;面向Web信息检索的知识挖掘[D];中国科学技术大学;2010年

    7 郭永明;XML文档交互式信息检索技术研究[D];东华大学;2010年

    8 林古立;互联网信息检索中的多样化排序研究及应用[D];华南理工大学;2011年

    9 马马杜 桑卡雷;基于多智能体的流体动力行业虚拟联盟信息检索的研究[D];浙江大学;2002年

    10 刘云峰;基于潜在语义分析的中文概念检索研究[D];华中科技大学;2005年

    中国硕士学位论文全文数据库 前10条

    1 乔智勇;Web数据挖掘系统的设计及关键技术研究[D];西安电子科技大学;2002年

    2 杨才峰;基于自动分类的元搜索引擎的研究与应用[D];华北电力大学(河北);2005年

    3 郭磊;P2P系统中的信息检索理论及应用研究[D];山东师范大学;2011年

    4 宋海林;基于语言模型的信息检索中负反馈技术的研究与实现[D];内蒙古大学;2011年

    5 管玉娟;基于智能Agent的个性化信息检索技术研究[D];西安建筑科技大学;2005年

    6 杭月芹;基于文档查询信息的检索系统研究与实现[D];扬州大学;2005年

    7 刘壁松;策略可扩展的搜索引擎研究和实现[D];清华大学;2005年

    8 史锦荣;基于多Agent智能搜索引擎模型研究[D];太原理工大学;2005年

    9 胡小睿;基于Web挖掘的搜索引擎技术研究[D];武汉大学;2005年

    10 吴媛媛;移动终端上个人信息检索核心子系统的设计与实现[D];北京邮电大学;2011年


      本文关键词:P2P系统中的信息检索理论及应用研究,,由笔耕文化传播整理发布。



    本文编号:165690

    资料下载
    论文发表

    本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/165690.html


    Copyright(c)文论论文网All Rights Reserved | 网站地图 |

    版权申明:资料由用户7a83e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com