当前位置:主页 > 科技论文 > 信息工程论文 >

非结构化对等网络中的信息检索若干关键技术研究

发布时间:2016-08-29 16:14

  本文关键词:非结构化对等网络中的信息检索若干关键技术研究,,由笔耕文化传播整理发布。


《国防科学技术大学》 2009年

非结构化对等网络中的信息检索若干关键技术研究

李绍滋  

【摘要】: 论文针对非结构化P2P网络中的信息检索问题,在系统地分析了现有关键技术及存在不足的基础上,提出了一种基于移动Agent的新型非结构化P2P信息检索模型。该模型充分利用移动Agent的高度自治性和异构性,避免了传统消息机制检索模型过多的网络连接和应答;同时将词汇链表示引入P2P信息检索,并强化信息推荐对改善蚁群算法信息素的作用,分别用基于信息推荐的蚁群算法和自适应扩散混合变异机制粒子群算法选择P2P查询路由。这些研究内容是非结构化P2P网络中的研究重点,具有重要的理论意义和实际应用价值。论文的主要研究工作及创新点如下: (1)提出了一种基于移动Agent的新型非结构化P2P信息检索模型。传统非结构化P2P信息检索模型普遍采用消息机制进行信息查询,这种机制要求发送者与接收者之间始终保持连接直到产生应答为止,对网络性能要求较高,不利于降低对网络带宽的占用。为克服传统模型的缺陷,本文充分利用移动Agent的高度自主性和异构性,提出了一种基于移动Agent的新型非结构化P2P信息检索模型,避免了传统消息机制检索模型过多的网络连接和应答。 (2)提出了基于词汇链的非结构化P2P信息检索方法,实现了非结构化P2P环境下的语义检索。在信息检索的文本表示中,充分利用《WordNet》等义类词典,构建词汇链向量表示替代传统关键词向量表示,提出了词汇链的量化方法,解决了一词多义及一义多词问题,能较好处理词汇的相关性,提高了主题表达能力。同时,为更准确地获取用户的查询需求,提出了基于进化算法的词汇链查询模板学习算法。仿真实验结果表明:信息检索中采用词汇链表示,不仅在传统非结构化P2P网络上实现了语义检索和不同粒度的信息检索,而且提高了检索的准确率。 (3)提出了基于信息推荐的改进蚁群算法,增强了查询路由算法对各节点拥有信息的掌握,克服了传统查询路由算法的盲目性。由于在非结构化P2P网络中选择路由类似于蚁群觅食的过程,因此,蚁群算法非常适合用于选择P2P路由。为更好地掌握各节点的信息,文中将信息推荐技术应用于更新蚁群算法的信息素,改变了传统的P2P网络仅仅依靠查询历史来更新信息素的方法,这样做,不但可以加快本次信息查询,而且还能在推荐过程经过的Peer节点上留下更多有用信息,有利于克服传统查询路由算法的盲目性。仿真实验结果表明:基于信息推荐的改进蚁群算法对查询算法的成功率、查全率及带宽占用率都有一定程度的改善。 (4)提出了自适应扩散混合变异机制的改进粒子群算法InformPSO,从理论和仿真实验上验证了该算法的有效性,并将其应用到非结构化P2P网络的查询路由优化中,提高了查询的准确性。在我们提出的检索算法运行初期,首先使用蚁群算法进行路由选择,收集并掌握以当前节点为中心的受限P2P网络内各节点的情况。然后充分利用了当前节点掌握的其它节点信息,并将P2P网络的查询路由看成最短路径问题,借助于改进的PSO算法寻找最短路径的方式来确定下一步的查询方向。仿真实验结果表明:我们提出的改进PSO算法与第五章的蚁群算法相比,在查询成功率、查询速度和带宽占用率方面都有所改善。 总之,在改进传统非结构化P2P网络信息检索的查询机制、实现语义检索及查询路由方面,本文首先提出了一种基于移动Agent的新型非结构化P2P信息检索模型,并通过引入词汇链实现语义检索,采用基于主动信息推荐的改进蚁群算法和改进粒子群算法来选择路由。仿真实验结果表明:这些方法提高了检索速度,避免了路由选择的盲目性,具有很好的实际应用价值。

【关键词】:
【学位授予单位】:国防科学技术大学
【学位级别】:博士
【学位授予年份】:2009
【分类号】:TP391.3
【目录】:

  • 摘要11-13
  • ABSTRACT13-15
  • 第一章 绪论15-33
  • 1.1 研究背景15-24
  • 1.1.1 对等网络的产生15-17
  • 1.1.2 对等网络的定义17-18
  • 1.1.3 对等网络的特征18-19
  • 1.1.4 对等网络的分类19-22
  • 1.1.5 对等网络的应用22-24
  • 1.2 研究现状及存在的问题24-29
  • 1.2 1 P2P 计算的研究现状24-26
  • 1.2.2 P2P 计算的优势26-28
  • 1.2.3 基于对等计算的信息检索面临的挑战28-29
  • 1.3 本文的主要研究工作及创新29-30
  • 1.4 论文的结构30-31
  • 1.5 本章小结31-33
  • 第二章 相关研究工作33-51
  • 2.1 信息检索的相关模型33-40
  • 2.1.1 布尔模型33-34
  • 2.1.2 向量空间模型34-36
  • 2.1.3 概率模型36-37
  • 2.1.4 统计语言模型37-40
  • 2.2 对等网络中的小世界模型40-44
  • 2.2.1 幂律40-43
  • 2.2.2 小世界理论43-44
  • 2.3 常见P2P 信息检索方法44-48
  • 2.3.1 基于集中式索引服务器的信息检索44-45
  • 2.3.2 基于非结构化P2P 网络的信息检索45-47
  • 2.3.3 基于结构化P2P 网络的信息检索47-48
  • 2.4 信息推送技术48-49
  • 2.5 本章小结49-51
  • 第三章 基于移动Agent 的新型非结构化P2P 信息检索模型51-63
  • 3.1 传统非结构化P2P 信息检索模型的不足51-54
  • 3.1.1 泛洪策略分布信息搜索51-52
  • 3.1.2 启发式分布信息搜索52-53
  • 3.1.3 传统搜索模型的不足53-54
  • 3.2 模型选择策略54-58
  • 3.2.1 移动Agent 的特点54-56
  • 3.2.2 移动Agent 与P2P 的结合56
  • 3.2.3 新型模型的选择标准56-58
  • 3.3 基于移动Agent 的新型非结构化P2P 信息检索模型设计58-62
  • 3.3.1 模型的整体结构58-59
  • 3.3.2 检索模型节点的组成元素59-61
  • 3.3.3 移动Agent 的表示61-62
  • 3.3.4 模型的创新性62
  • 3.4 本章小结62-63
  • 第四章 基于词汇链的文本表示与检索技术63-91
  • 4.1 词汇链的基本概念63-66
  • 4.1.1 词的集聚性63-64
  • 4.1.2 词汇链的定义64-65
  • 4.1.3 词汇集聚为何重要65
  • 4.1.4 词汇链的应用65-66
  • 4.2 基于词汇链的信息检索66-68
  • 4.2.1 基于关键词信息检索方法的局限性66-67
  • 4.2.2 引入词汇链的优势67-68
  • 4.3 词汇链的构建方法68-76
  • 4.3.1 候选词的选择68-69
  • 4.3.2 词汇语义关联度的分类69-71
  • 4.3.3 路径的选择71-72
  • 4.3.4 词汇链的构建算法72-74
  • 4.3.5 算法应用实例74-76
  • 4.3.6 词汇语义关联度的计算76
  • 4.4 文本的词汇链表示方法76-84
  • 4.4.1 文本表示流程76-78
  • 4.4.2 文本预处理78-79
  • 4.4.3 关键词提取79-80
  • 4.4.4 利用词汇链进行岐义消解80-83
  • 4.4.5 文本的词汇链向量表示83
  • 4.4.6 文本之间的相似度计算83-84
  • 4.5 基于遗传算法的进化式词汇链学习算法84-87
  • 4.5.1 遗传算法一般框架84-86
  • 4.5.2 进化式词汇链查询模板学习算法86-87
  • 4.6 仿真实验87-90
  • 4.6.1 实验语料库87-88
  • 4.6.2 评价参数88-89
  • 4.6.3 实验结果89-90
  • 4.7 本章小结90-91
  • 第五章 基于蚁群算法的非结构化P2P 信息检索路由选择91-111
  • 5.1 非结构化P2P 信息检索路由91-93
  • 5.1.1 非结构化P2P 网络中的信息检索路由描述91
  • 5.1.2 现有非结构化P2P 检索路由方法91-92
  • 5.1.3 现有路由方法的缺陷92-93
  • 5.2 基本蚁群算法93-98
  • 5.2.1 基本蚁群算法93-94
  • 5.2.2 蚁群算法的应用94-95
  • 5.2.3 开放平台Anthill 分析95-98
  • 5.3 基于信息推荐的改进蚁群算法98-103
  • 5.3.1 信息推荐算法98-99
  • 5.3.2 基于信息推荐的改进蚁群算法99-100
  • 5.3.3 基于改进蚁群算法的非结构化P2P 信息检索方法100-103
  • 5.4 仿真实验103-110
  • 5.4.1 实验环境103
  • 5.4.2 实验步骤103-104
  • 5.4.3 评价指标104-105
  • 5.4.4 实验结果与分析105-110
  • 5.5 本章小结110-111
  • 第六章 基于改进PSO 算法的查询路由优化111-129
  • 6.1 非结构化P2P 网络查询路由优化问题的描述111-112
  • 6.2 基本的PSO 算法112-113
  • 6.3 含自适应扩散机制的混合变异PSO 算法113-118
  • 6.3.1 早熟收敛原因113
  • 6.3.2 改进算法基本原理113-116
  • 6.3.3 全局收敛性116-118
  • 6.4 改进算法的有效性验证118-123
  • 6.4.1 基准函数问题118-119
  • 6.4.2 参数设置119-120
  • 6.4.3 对比实验120-123
  • 6.5 基于InformPSO 的P2P 网络路由算法123-125
  • 6.5.1 问题描述123
  • 6.5.2 编码机制123-124
  • 6.5.3 适应度函数124
  • 6.5.4 算法描述124-125
  • 6.6 路由优化仿真实验125-128
  • 6.6.1 仿真平台PeerSim125
  • 6.6.2 拓扑生成器BRITE125-126
  • 6.6.3 实验结果及分析126-128
  • 6.7 本章小结128-129
  • 第七章 结论与展望129-131
  • 7.1 本文工作总结129-130
  • 7.2 下一步工作展望130-131
  • 致谢131-133
  • 参考文献133-141
  • 作者在学期间取得的学术成果141-143
  • 附录 A 作者在学期间主持或参加的科研项目143
  • 下载全文 更多同类文献

    CAJ全文下载

    (如何获取全文? 欢迎:购买知网充值卡、在线充值、在线咨询)

    CAJViewer阅读器支持CAJ、PDF文件格式


    【相似文献】

    中国期刊全文数据库 前10条

    1 尤文建,李绍滋,李堂秋;基于词汇链的文本过滤模型[J];计算机应用研究;2003年09期

    2 曾韬;应用非结构化信息管理技术实现多层次知识管理需求[J];中国传媒科技;2004年06期

    3 ;整合需求和挑战:驾驭非结构化信息[J];中国制造业信息化;2006年24期

    4 ;技术驱动 引领未来——访SAP大中华地区首席技术官 张侠[J];中国制造业信息化;2006年24期

    5 金烨;;第27期CIO富营活动 透视金融业“非结构化”[J];中国计算机用户;2009年17期

    6 刘文革,马果礼;用影像扫描存贮非结构化信息[J];中国煤炭;2001年09期

    7 夏曼;陈珊珊;;浅谈非结构化网络课程[J];中国教育技术装备;2011年18期

    8 张明宝;谢宗旺;;一种基于知网的中文词汇链构建算法研究[J];软件导刊;2008年10期

    9 武君胜,吴广茂,冯晓慧;适应于3维非结构化网格数据场的切片可视化技术研究[J];西安电子科技大学学报;1996年03期

    10 刘健;尹春霞;原福永;;基于非结构化P2P网络用户模型的协同过滤推荐机制[J];山东大学学报(理学版);2011年05期

    中国重要会议论文全文数据库 前10条

    1 顾晋广;陈和平;杨玲贤;;基于本体的非结构化信息访问机制研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年

    2 徐陈锋;奚宏生;江琦;殷保群;;一类分层非结构化P2P系统的随机优化[A];第二十六届中国控制会议论文集[C];2007年

    3 祝世京;陈珽;;非结构化冲突问题分析的研究[A];企业发展与系统工程——中国系统工程学会第七届年会论文集[C];1992年

    4 魏建明;王晓云;张琳娜;;非结构化网格技术在小区风场模拟中的应用[A];计算流体力学研究进展——第十二届全国计算流体力学会议论文集[C];2004年

    5 杨满栋;李闽峰;郝平;米宏亮;李圣强;;非结构化时间序列地震数据信息网络服务系统[A];2001年中国地球物理学会年刊——中国地球物理学会第十七届年会论文集[C];2001年

    6 赵雷;杨季文;;一种基于非结构化视图的企业数据建模方法[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年

    7 彭俊杰;卢正鼎;李瑞轩;;一种改进的非结构化P2P网络搜索方法[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年

    8 杨小涛;邓苏;黄宏斌;;一种基于访问频率的非结构化P2P复制策略[A];2008年全国开放式分布与并行计算机学术会议论文集(下册)[C];2008年

    9 沙芸;周俊武;张国英;;基于主题关键词的新闻去重算法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

    10 王志强;王雪标;王振山;;蒙代尔-弗莱明模型的非结构化经验分析:来自中国的证据[A];第三届中国金融论坛论文集[C];2004年

    中国重要报纸全文数据库 前10条

    1 ;[N];科技日报;2006年

    2 ;[N];中国计算机报;2004年

    3 徐昕;[N];中国计算机报;2005年

    4 郭莹;[N];中国计算机报;2006年

    5 杨丽;[N];科技日报;2006年

    6 冠;[N];计算机世界;2008年

    7 晓文;[N];中国经济导报;2006年

    8 陈伟;[N];中国档案报;2008年

    9 本报记者 周锦鸾;[N];中国计算机报;2001年

    10 胥小红;[N];科技日报;2007年

    中国博士学位论文全文数据库 前10条

    1 李绍滋;非结构化对等网络中的信息检索若干关键技术研究[D];国防科学技术大学;2009年

    2 贾兆庆;非结构化P2P中搜索算法及信任机制研究[D];上海交通大学;2008年

    3 朱桂明;非结构化对等网络资源定位技术研究[D];国防科学技术大学;2010年

    4 张珂;面向服务发现应用的非结构化覆盖网络建模与分析[D];清华大学;2009年

    5 李浩;新产品非结构化需求转换、概念测试与初始配置方法研究[D];重庆大学;2012年

    6 王铁军;非结构化对等网络资源定位技术研究[D];电子科技大学;2010年

    7 王平;非结构化对等网络中的信任机制及搜索策略研究[D];西南大学;2010年

    8 王志力;基于Godunov和Semi-Lagrangian法的二、三维浅水方程的非结构化网格离散研究[D];大连理工大学;2006年

    9 宋超;非结构化自适应有限元网格生成的AFT方法[D];大连理工大学;2004年

    10 陈珊珊;非结构化P2P网络信任模型及激励机制研究[D];南京邮电大学;2011年

    中国硕士学位论文全文数据库 前10条

    1 杨玲贤;基于Ontology的非结构化信息访问机制研究[D];武汉科技大学;2004年

    2 张丽;基于非结构化补充数据业务的客户服务系统研究[D];重庆大学;2004年

    3 邓业强;支持协同的分布式本体管理系统的设计和实现[D];上海交通大学;2010年

    4 沈贺丹;核心能力评价系统的分类模块研究[D];辽宁工程技术大学;2006年

    5 王芯婷;非结构化金融数据管理系统的设计与实现[D];华中科技大学;2012年

    6 陈斌;基于语义的金融企业非结构化信息检索系统研究[D];上海交通大学;2011年

    7 李薇;非结构化P2P网络搜索算法研究[D];西安理工大学;2010年

    8 潘正军;基于激励的P2P非结构化自我优化搜索算法研究[D];太原理工大学;2010年

    9 曾家国;基于兴趣域的非结构化P2P搜索算法研究[D];重庆大学;2010年

    10 周欢;非结构化P2P网络资源搜索算法研究[D];长沙理工大学;2012年


      本文关键词:非结构化对等网络中的信息检索若干关键技术研究,由笔耕文化传播整理发布。



    本文编号:104894

    资料下载
    论文发表

    本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/104894.html


    Copyright(c)文论论文网All Rights Reserved | 网站地图 |

    版权申明:资料由用户ca8b4***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com