当前位置:主页 > 科技论文 > 搜索引擎论文 >

《哈尔滨工业大学》2007年硕士论文

发布时间:2016-07-12 07:04

  本文关键词:基于多Agent的搜索引擎优化研究,,由笔耕文化传播整理发布。


《哈尔滨工业大学》 2007年

基于多Agent的搜索引擎优化研究

王海腾  

【摘要】: 近几年来,随着计算机和网络的发展,互联网信息成指数级增长,搜索引擎已经成为用户上网必不可少的工具。传统搜索引擎的优点是信息量大,更新及时,无需人工干预,但随着网络信息的成倍增长,海量搜索技术的弊端也日益明显,返回信息过多,夹杂着大量重复或无关的信息,必须从检索结果中自行进行二次或多次筛选,无形中降低了搜索的准确性。迫切需要能有新的技术来解决这些问题。 本课题研究了基于多Agent的优化搜索的几个关键问题,从第二代搜索当前所存在的问题出发,对搜索引擎的进行进一步优化。 在关键词匹配搜索的前提下,通过客户端和服务器端的Agent的交互,用机器学习的方法,详细分析用户的点击和浏览行为来改进服务,把用户的对网页的重要性判断考虑进去,更好的利用用户相关性反馈信息,使信息的重要性的判断上增加整个用户群体的判断来改进服务器端的算法,优化整个搜索引擎的总体性能。提出了在搜索过程中人机相互协作的重要思想。 通过客户端和服务器端的Agent的交互,把具体到某用户搜索行为时的不确定性和个性考虑进去,通过用户使用前提交的兴趣偏好信息和历史浏览行为,来增加对于具体某个用户搜索接口的个性和智能性。 本文首先对传统搜索引擎技术和分类进行了介绍,然后对Agent的定义和系统体系结构及用户兴趣学习技术进行了详细的介绍。随后设计出了自己的基于多Agent的搜索引擎的体系结构,详细设计了各Agent的功能。最后在服务器端使用元搜索引擎的情况下,模拟和实现了客户端各Agent的搜索行为,并作了对比实验。

【关键词】:
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2007
【分类号】:TP391.3
【目录】:

  • 摘要4-5
  • Abstract5-9
  • 第1章 绪论9-16
  • 1.1 课题背景9
  • 1.2 智能信息检索系统国内外现状9-11
  • 1.3 搜索引擎的评价标准和传统搜索引擎的不足11-13
  • 1.3.1 搜索引擎的评价标准11
  • 1.3.2 传统搜索引擎的不足11-13
  • 1.4 基于Agent的搜索引擎的研究目的和意义13-14
  • 1.5 主要研究内容14-16
  • 第2章 搜索引擎的当前技术概述16-22
  • 2.1 当前搜索引擎的分类16-17
  • 2.1.1 基于Robot的搜索引擎16
  • 2.1.2 目录式搜索引擎16-17
  • 2.1.3 元搜索引擎17
  • 2.2 基于Robot的搜索引擎的组成和基本原理17-19
  • 2.2.1 搜索器18
  • 2.2.2 索引器18-19
  • 2.2.3 检索器19
  • 2.2.4 用户接口19
  • 2.3 当前搜索引擎的关键技术19-21
  • 2.3.1 搜索引擎中数据的存储19
  • 2.3.2 中文分词技术19-20
  • 2.3.3 数据库与Web的集成20
  • 2.3.4 文档相关性的计算20-21
  • 2.4 本章小结21-22
  • 第3章 Agent技术和用户兴趣学习技术概述22-33
  • 3.1 Agent的产生与定义22-23
  • 3.1.1 Agent产生、发展和定义22-23
  • 3.1.2 Agent的特征23
  • 3.2 Agent技术现状与关键问题23-25
  • 3.2.1 Agent目前的技术23-24
  • 3.2.2 面临的关键问题24-25
  • 3.3 当前Agent技术在搜索引擎方面的应用25
  • 3.4 用户兴趣挖掘25-27
  • 3.4.1 用户兴趣挖掘技术25-26
  • 3.4.2 网络信息挖掘技术26-27
  • 3.5 用户兴趣模型标识及学习方法27-32
  • 3.5.1 文档的表示27-28
  • 3.5.2 用户兴趣和信息需求的特点28-30
  • 3.5.3 用户兴趣模型的四个学习方法30-32
  • 3.5.4 用户兴趣模型的两个构建方法32
  • 3.6 本章小结32-33
  • 第4章 基于Agent技术的搜索引擎的设计33-45
  • 4.1 传统搜索引擎的不足和基于Agent技术的搜索引擎的改进33
  • 4.2 总体设计思想33-35
  • 4.3 基于多Agent的搜索引擎的主要技术35-44
  • 4.3.1 客户端Agent的设计35-39
  • 4.3.2 服务端Agent的设计39-44
  • 4.4 本章小结44-45
  • 第5章 客户端多Agent搜索的实现和模拟45-66
  • 5.1 JADE平台简介45-47
  • 5.1.1 JADE平台的结构45-46
  • 5.1.2 JADE平台的通信语言46-47
  • 5.1.3 JADE的行为类47
  • 5.2 JADEX简介47-54
  • 5.2.1 Jadex的BDI模型48-50
  • 5.2.2 Jadex代理的执行50-54
  • 5.3 客户端多Agent搜索的实现54-63
  • 5.3.1 文本分析器54-55
  • 5.3.2 用户接口Agent55-60
  • 5.3.3 后台分析Agent60-63
  • 5.4 模拟多Agent的搜索引擎63-65
  • 5.4.1 系统评价理论64
  • 5.4.2 系统评价实验64-65
  • 5.5 本章小结65-66
  • 结论66-67
  • 参考文献67-71
  • 附录1 关联规则挖掘类71-76
  • 附录2 关键词类76-77
  • 附录3 关键词统计类77-79
  • 附录4 显示关联规则类79-81
  • 附录5 搜索Agent类81-85
  • 附录6 搜索界面类85-92
  • 附录7 分析Agent类92-95
  • 攻读学位期间发表的学术论文95-97
  • 致谢97
  • 下载全文 更多同类文献

    CAJ全文下载

    (如何获取全文? 欢迎:购买知网充值卡、在线充值、在线咨询)

    CAJViewer阅读器支持CAJ、PDF文件格式


    【引证文献】

    中国硕士学位论文全文数据库 前2条

    1 刘靖媛;个性搜索引擎中用户兴趣模型研究[D];哈尔滨工程大学;2010年

    2 谢飞;基于SEO理论的物业企业网络学习平台的研究与设计[D];北京林业大学;2012年

    【参考文献】

    中国期刊全文数据库 前2条

    1 李广建,黄崑;元搜索引擎及其主要技术[J];情报科学;2002年02期

    2 赵静,王玉平;目前我国搜索引擎研究的现状与发展[J];情报科学;2003年08期

    【共引文献】

    中国期刊全文数据库 前10条

    1 刘高原;张国平;;基于Nutch的搜索引擎技术[J];平顶山学院学报;2008年05期

    2 向广利;;基于移动Agent的考试系统研究[J];湖北教育学院学报;2006年02期

    3 邓芳;;基于Agent的信息处理方法浅析[J];湖北教育学院学报;2006年08期

    4 田喜平;赵红丹;;基于案例推理的重复谈判研究[J];新乡学院学报(自然科学版);2010年01期

    5 许家梁;一种按内容优选信息的“信息筛”的数学模型[J];情报科学;2000年07期

    6 朱华;中文搜索引擎结构初探[J];情报科学;2001年11期

    7 赵静;加强对搜索引擎的“书目控制”[J];情报科学;2002年05期

    8 赵静,王玉平;目前我国搜索引擎研究的现状与发展[J];情报科学;2003年08期

    9 楼松斋,张惠惠;中文电子期刊的元搜索引擎[J];情报科学;2003年11期

    10 王成云,王乐乐;基于页面链接挖掘的Web教育信息检索[J];情报科学;2004年04期

    中国重要会议论文全文数据库 前10条

    1 赵开芹;王峰;李明楚;;生态网格平台上的网格服务突现[A];节能环保 和谐发展——2007中国科协年会论文集(一)[C];2007年

    2 郑凯;余雪丽;王莉;;基于Agent的网格服务信息管理[A];全国ISNBM学术交流会暨电脑开发与应用创刊20周年庆祝大会论文集[C];2005年

    3 王浩;;基于Agent的P2P文件共享系统的研究[A];2009年研究生学术交流会通信与信息技术论文集[C];2009年

    4 许庆华;;一种实现Aglets系统安全机制的方法[A];2009年研究生学术交流会通信与信息技术论文集[C];2009年

    5 汤薇;曾艳;;构建校园网搜索引擎必要性分析[A];广西计算机学会2008年年会论文集[C];2008年

    6 梁伟贤;;网络搜索引擎发展现状的探讨[A];2007中国科协年会——通信与信息发展高层论坛论文集[C];2007年

    7 罗欢;;分布式控制系统体系结构的Multi-Agent模型[A];2003中国控制与决策学术年会论文集[C];2003年

    8 赵京胜;巩玉玺;;基于移动Agent的软件开发技术研究[A];第一届中国高校通信类院系学术研讨会论文集[C];2007年

    9 余毅敏;何川;杨青彬;;浅析移动Agent技术及其在TMN管理中的应用优势[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年

    10 刁丽娟;;基于人工免疫系统的进化性网格服务突现[A];2008通信理论与技术新发展——第十三届全国青年通信学术会议论文集(下)[C];2008年

    中国博士学位论文全文数据库 前10条

    1 陈得宇;基于MAS的智能电压控制系统研究[D];哈尔滨工程大学;2010年

    2 赵丽宁;基于多AGENT的智能航运信息系统关键技术研究[D];大连海事大学;2010年

    3 熊晶;海洋生态本体的建模方法研究及应用[D];中国海洋大学;2010年

    4 杜曼玲;供应链过程管理的分析方法与技术实现[D];北京交通大学;2010年

    5 黄永忠;移动代理计算模型及其在分布并行计算中的应用研究[D];解放军信息工程大学;2007年

    6 马鑫;基于协同机制和智能算法的多代理系统研究及应用[D];吉林大学;2011年

    7 张长利;面向特定领域的互联网舆情分析技术研究[D];吉林大学;2011年

    8 田俊华;基于本体知识库的教学资源自动采集技术研究[D];南京师范大学;2011年

    9 章德斌;基于Agent技术的辊弯成型过程系统结构模型研究[D];燕山大学;2011年

    10 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年

    中国硕士学位论文全文数据库 前10条

    1 左宗乐;多移动Agent动态协作在P2P文件共享中的应用研究[D];安徽工程大学;2010年

    2 程宾;基于用户兴趣模型的元搜索引擎的研究[D];山东科技大学;2010年

    3 岳广飞;基于二次搜索的搜索引擎技术研究[D];山东科技大学;2010年

    4 徐财应;基于Lucene的搜索引擎技术的研究与改进[D];长春理工大学;2010年

    5 雷斌;基于Java技术的智能化搜索引擎的研究与设计[D];哈尔滨工程大学;2010年

    6 蔡宇虹;基于主题的元搜索引擎关键技术研究[D];哈尔滨工程大学;2010年

    7 汪永伟;搜索引擎中网页排序算法的研究与实现[D];哈尔滨工程大学;2010年

    8 秦宏宇;网络舆情热点发现相关技术研究[D];哈尔滨工程大学;2010年

    9 郭世胜;基于Agent的搜索引擎的研究与实现[D];大连海事大学;2010年

    10 朱莹婷;基于迁移学习理论的Markov检索模型[D];江西师范大学;2010年

    【同被引文献】

    中国期刊全文数据库 前6条

    1 焦微玲;论提高中文搜索引擎质量的途径[J];情报科学;2002年01期

    2 张启宇;朱玲;张雅萍;;中文分词算法研究综述[J];情报探索;2008年11期

    3 张玉峰,晏创业;基于Agent的个性化信息服务模型研究[J];情报学报;2001年05期

    4 董峰;刘远军;;数据挖掘中决策树SPRINT算法探讨[J];邵阳学院学报(自然科学版);2007年02期

    5 张李义;李亚子;;基于反序词典的中文逆向最大匹配分词系统设计[J];现代图书情报技术;2006年08期

    6 张春霞,郝天永;汉语自动分词的研究现状与困难[J];系统仿真学报;2005年01期

    中国博士学位论文全文数据库 前3条

    1 刘炜;智能元搜索引擎中个性化模式库的研究[D];太原理工大学;2007年

    2 周翀;搜索引擎中文档聚类方法研究[D];华中科技大学;2009年

    3 史斌;面向语义网的语义搜索引擎关键技术研究[D];北京工业大学;2010年

    中国硕士学位论文全文数据库 前10条

    1 张巍;基于PageRank算法的搜索引擎优化策略研究[D];四川大学;2005年

    2 苏磊;面向搜索引擎优化的网站建设方法研究[D];天津大学;2006年

    3 林海霞;中文专业搜索引擎优化策略研究[D];燕山大学;2006年

    4 赵蕊;基于WEKA平台的决策树算法设计与实现[D];中南大学;2007年

    5 蔡国民;基于XML的个性化信息检索系统研究[D];中南大学;2007年

    6 张光年;企业网站的搜索引擎优化研究[D];厦门大学;2007年

    7 张晖;基于社会化标注的搜索引擎优化研究[D];扬州大学;2008年

    8 孙荣霜;面向主题的多Agent搜索系统[D];扬州大学;2008年

    9 黄艳;基于Web的个性化信息检索技术研究[D];西北大学;2008年

    10 周翔;基于e-learning模式的培训管理研究[D];武汉科技大学;2008年

    【二级引证文献】

    中国硕士学位论文全文数据库 前1条

    1 杨斐斐;基于群组的个性化检索技术研究及应用[D];西北大学;2012年

    【二级参考文献】

    中国期刊全文数据库 前10条

    1 王娟琴;网络信息检索模式研究[J];情报科学;1999年03期

    2 宛玲,杨秀丹,杜晓静;试析中文搜索引擎的评价标准[J];情报科学;2000年01期

    3 郭万召;网络搜索引擎的分析与比较研究[J];情报科学;2000年01期

    4 王玉波;专业搜索引擎的开发研究[J];情报科学;2000年12期

    5 曹东,韩全惜,庄军;运用情报检索语言理论与方法完善搜索引擎的功能[J];情报理论与实践;2000年01期

    6 郝小花;用搜索引擎在万维网上检索信息[J];情报理论与实践;2000年04期

    7 杨桂珍;多元搜索引擎研究[J];情报理论与实践;2001年04期

    8 韩圣龙;网络信息检索工具评价指标[J];情报学报;2001年04期

    9 刘开瑛,郑家恒,刘静;基于《金融档案分类表》的自动分类算法研究[J];情报学报;1997年05期

    10 许建潮,胡明;文书类档案的分类标引研究[J];情报学报;1999年03期

    中国知网广告投放

    《哈尔滨工业大学》2007年硕士论文

    《中国学术期刊(光盘版)》电子杂志社有限公司
    同方知网数字出版技术股份有限公司
    地址:北京清华大学 84-48信箱 知识超市公司
    京ICP证040441号
    互联网出版许可证 新出网证(京)字008号
    出版物经营许可证 新出发京批字第直0595号

    订购热线:400-819-9993 010-62982499
    服务热线:010-62985026 010-62791813
    在线咨询:
    传真:010-62780361
    京公网安备11010802020475号



      本文关键词:基于多Agent的搜索引擎优化研究,由笔耕文化传播整理发布。



    本文编号:69419

    资料下载
    论文发表

    本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/69419.html


    Copyright(c)文论论文网All Rights Reserved | 网站地图 |

    版权申明:资料由用户87a2c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com