当前位置:主页 > 科技论文 > 搜索引擎论文 >

元搜索引擎调度策略及结果排序算法的研究

发布时间:2016-08-12 12:05

  本文关键词:元搜索引擎调度策略及结果排序算法的研究,由笔耕文化传播整理发布。


《燕山大学》 2010年

元搜索引擎调度策略及结果排序算法的研究

王金栋  

【摘要】: 随着互联网的蓬勃发展,网上信息资源呈几何级数的速度增长。搜索引擎的出现帮助广大网民迅速定位到自己想要的信息,节省了用户在漫无边际的网络中查找信息的时间,但是单个搜索引擎的覆盖率却随着网络信息的快速增长而开始下降。为了提高搜索的覆盖范围,元搜索引擎应运而生。元搜索引擎是利用现有的独立搜索引擎的查询性能,将它们看作一个整体,为用户提供一个统一的查询界面并返回结果。本文在综合分析国内外有关元搜索引擎排序技术的基础上,对如何提高元搜索引擎精度进行了深入的研究。 首先,介绍了独立搜索引擎和元搜索引擎中一些相关的基础知识,并在此基础上深入地分析了元搜索引擎存在的必要性以及当前存在的不足。针对用户查询信息不足的问题,提出一种基于元搜索引擎的查询扩展的方法,利用该方法对用户的查询词进行扩展,然后选取与原查询词贴近度最大的几个扩展词,进行输入并按照一定的排序算法返回结果。 其次,元搜索引擎的调度策略是元搜索引擎的关键技术,在对已有的一些调度算法介绍并分析的基础上,提出一种新的元搜索引擎的调度方法,该方法从系统和用户两方面入手,系统按照一定的方法选择出系统认为是最重要的几个通用搜索引擎,用户则从主观上挑选出几个优秀的专业搜索引擎,按此方法对独立搜索引擎进行调度。并通过实验对提出的调度方法进行验证。 最后,针对元搜索引擎如何进一步提高搜索精度的问题,在介绍和分析当前一些主要的结果排序算法的基础上,提出一种基于位置/网页摘要与标题相结合的排序算法来对元搜索引擎结果进行合并,并最终通过实验对所提出的算法的有效性进行了验证。

【关键词】:
【学位授予单位】:燕山大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP391.3
【目录】:

  • 摘要5-7
  • ABSTRACT7-12
  • 第1章 绪论12-19
  • 1.1 研究背景12-13
  • 1.2 研究意义13-14
  • 1.2.1 传统搜索引擎的局限性13
  • 1.2.2 元搜索引擎的优势13-14
  • 1.3 元搜索引擎的研究现状14-17
  • 1.4 本文研究内容17
  • 1.5 本文的组织结构17-19
  • 第2章 搜索引擎概述19-31
  • 2.1 引言19
  • 2.2 搜索引擎的分类19-22
  • 2.3 独立搜索引擎22-24
  • 2.3.1 搜索引擎的结构和原理22-24
  • 2.3.2 搜索引擎的评价指标24
  • 2.4 元搜索引擎24-29
  • 2.4.1 元搜索引擎的工作原理和架构24-25
  • 2.4.2 元搜索引擎分类25-27
  • 2.4.3 元搜索引擎的评价指标27-28
  • 2.4.4 元搜索引擎未来的发展趋势28-29
  • 2.5 元搜索引擎与独立搜索引擎的比较29-30
  • 2.6 本章小结30-31
  • 第3章 查询扩展研究31-40
  • 3.1 基于局部信息的查询扩展31-33
  • 3.1.1 基于局部聚类的查询扩展31-32
  • 3.1.2 基于局部上下文的查询扩展32-33
  • 3.2 基于全局分析的查询扩展33-34
  • 3.2.1 基于相似词典的查询扩展33
  • 3.2.2 基于统计词典的查询扩展33-34
  • 3.3 一种基于元搜索引擎的查询扩展的方法34-37
  • 3.3.1 扩展源的选定34-35
  • 3.3.2 查询扩展词权重的赋值35-37
  • 3.4 实验验证37-39
  • 3.4.1 实验环境37-38
  • 3.4.2 实验结果分析38-39
  • 3.5 本章小结39-40
  • 第4章 元搜索引擎的调度策略的研究40-53
  • 4.1 元搜索引擎的调度策略40-44
  • 4.1.1 普通方法41
  • 4.1.2 定性方法41-43
  • 4.1.3 定量方法43-44
  • 4.1.4 基于学习法44
  • 4.2 一种新的元搜索引擎的调度方法44-50
  • 4.2.1 调度方法的思想44-46
  • 4.2.2 调度方法的具体实施步骤46-47
  • 4.2.3 调度方法的超时问题处理47-49
  • 4.2.4 调度方法中术语集更新问题49-50
  • 4.3 实验验证50-51
  • 4.3.1 实验平台50-51
  • 4.3.2 实验结果分析51
  • 4.4 本章小结51-53
  • 第5章 元搜索引擎结果排序算法的研究53-68
  • 5.1 常见的结果排序算法53-58
  • 5.2 基于位置/网页摘要和标题的排序算法58-65
  • 5.2.1 元搜索引擎的结果去重58-59
  • 5.2.2 过滤广告网页59-60
  • 5.2.3 位置/网页摘要和标题排序法60-65
  • 5.3 实验验证65-67
  • 5.3.1 实验环境65
  • 5.3.2 实验结果分析65-67
  • 5.4 本章小结67-68
  • 结论68-70
  • 参考文献70-75
  • 致谢75-76
  • 作者简介76
  • 下载全文 更多同类文献

    CAJ全文下载

    (如何获取全文? 欢迎:购买知网充值卡、在线充值、在线咨询)

    CAJViewer阅读器支持CAJ、PDF文件格式


    【相似文献】

    中国期刊全文数据库 前10条

    1 高炜;兰美辉;;基于排序学习方法的本体映射算法[J];微电子学与计算机;2011年09期

    2 张冰波;宋荣华;;基于Web services的分布式信息检索机制的研究[J];软件导刊;2011年07期

    3 李培;;元搜索引擎资源选择融合方法的研究[J];图书馆工作与研究;2011年08期

    4 高炜;梁立;;两类新推进排序算法[J];计算机工程与科学;2011年07期

    5 杨超;李杰;李浩宇;;基于PageRank的页面排序算法研究[J];电脑编程技巧与维护;2011年16期

    6 李志义;梁士金;;国内网页去重技术研究:现状与总结[J];图书情报工作;2011年07期

    7 朱怡安;雷万保;;基于服务关联模型的服务排序算法——ServiceRank[J];电子科技大学学报;2011年04期

    8 包亚伟;赵慧;蒋华;王文博;吴斌;;一种新的高效MMSE-SIC检测算法[J];系统仿真学报;2011年07期

    9 宋立军;;浅论网络数学搜索中的数学查询语言与索引的研究[J];科技创新导报;2011年21期

    10 周磊;华钢;徐钊;徐冬梅;;基于先验模型的全局线索选择感知编组算法[J];电子学报;2011年08期

    中国重要会议论文全文数据库 前10条

    1 阳小华;刘振宇;谭敏生;刘杰;左贵启;;元搜索引擎查询结果的合成方法[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年

    2 李慧;张民;宋源清;;网络搜索引擎[A];2009全国计算机网络与通信学术会议论文集[C];2009年

    3 周晓方;金志权;;寻找最佳分布式排序算法[A];第九届全国数据库学术会议论文集(上)[C];1990年

    4 孟奇奎;;一种基于数据库和用户反馈信息的元搜索引擎数据库选择算法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年

    5 余晋;邓志鸿;田敬;唐世渭;;PinkySearch:基于聚类的元搜索引擎[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年

    6 吴冷冬;童云海;唐世渭;;面向在线音乐视频的元搜索引擎VMS[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年

    7 张志强;梁婷婷;谢晓芹;;一种基于用户标记的搜索结果排序算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年

    8 周小平;梁一平;邓左祥;;元搜索引擎研究[A];2009年中国高校通信类院系学术研讨会论文集[C];2009年

    9 夏小玲;祁博民;廖顺和;;基于Web服务和元搜索引擎的数字图书馆中元数据互操作框架[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年

    10 陈伟雄;马少平;步建华;;基于元搜索引擎的多关键词检索技术[A];广东省电机工程学会2003-2004年度优秀论文集[C];2005年

    中国重要报纸全文数据库 前10条

    1 山东 张蕊;[N];中国计算机报;2000年

    2 广东 黄陀;[N];电脑报;2001年

    3 ITBOY;[N];电脑报;2004年

    4 赵敏超;[N];中国图书商报;2003年

    5 王旭;[N];计算机世界;2001年

    6 彭岩 艾迪明;[N];计算机世界;2001年

    7 郑依华;[N];计算机世界;2006年

    8 胥小红;[N];大众科技报;2007年

    9 易观网络咨询公司;[N];中国计算机报;2000年

    10 PALADIN;[N];电脑报;2003年

    中国博士学位论文全文数据库 前10条

    1 李红梅;智能元搜索引擎关键技术研究[D];西安电子科技大学;2009年

    2 李强;基于本体论的个性化和社会化元搜索引擎的研究[D];浙江大学;2006年

    3 郝凡昌;有向基因组复合操作重组排序算法研究[D];山东大学;2011年

    4 刘炜;智能元搜索引擎中个性化模式库的研究[D];太原理工大学;2007年

    5 农庆琴;在线排序与路由安排[D];郑州大学;2006年

    6 尹晓;基因组重组排序问题的算法研究[D];山东大学;2010年

    7 王灿;基于半监督流形学习的Web信息检索技术研究[D];浙江大学;2009年

    8 刘旭;基于图剖分和图排序的负载平衡算法研究[D];中国工程物理研究院;2008年

    9 陈红涛;基于搜索日志的用户行为研究及应用[D];北京邮电大学;2008年

    10 杨远;MIMO系统中的检测算法研究[D];西安电子科技大学;2009年

    中国硕士学位论文全文数据库 前10条

    1 王金栋;元搜索引擎调度策略及结果排序算法的研究[D];燕山大学;2010年

    2 王莎莎;元搜索引擎结果合成技术的研究[D];燕山大学;2011年

    3 李彦威;基于用户兴趣的个性化元搜索引擎研究[D];燕山大学;2010年

    4 张腾宇;元搜索引擎中结果聚合排序方法的研究[D];北京工业大学;2012年

    5 申大明;带到达时间的单位工件在线排序[D];浙江大学;2007年

    6 彭聪;一种在移动网络环境下的网页排序算法的研究[D];湖南大学;2010年

    7 徐金雷;专业搜索引擎的排序算法研究[D];南京师范大学;2007年

    8 田志章;流水型CONWIP生产控制系统研究[D];武汉理工大学;2007年

    9 程建;一种网页搜索引擎原型系统的设计与实现[D];北京邮电大学;2009年

    10 李连江;个性化搜索引擎模型的研究与改进[D];哈尔滨工程大学;2008年


      本文关键词:元搜索引擎调度策略及结果排序算法的研究,,由笔耕文化传播整理发布。



    本文编号:92215

    资料下载
    论文发表

    本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/92215.html


    Copyright(c)文论论文网All Rights Reserved | 网站地图 |

    版权申明:资料由用户12883***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com