主题web搜索引擎优化和实现的研究.pdf
发布时间:2016-09-04 18:24
本文关键词:主题WEB搜索引擎优化与实现研究,,由笔耕文化传播整理发布。
文档介绍:
主题WEB搜索引擎优化与实现研究摘的快速发展,特别是全球最大的分布式信息数据库。一方面网络的信息量迅速猛增,为资源的共建共享提供了良好的平台,另一方面又使有用信息的索取和查询变得越来越困难。用户获得的信息往往不及时,不准确,并且有大量的冗余无关信息。因此在20世纪90年代开始,产生了搜索引擎技术,并随着需要,逐渐向专题型,个性化方向发展。如何加强主题搜索引擎技术的研究,实现更有效的信息获取,是当前搜索引擎发展的一个重要方向。本文在对搜索引擎技术讨论的基础上,对Web主题搜索引擎技术的优化和实现进行了研究。主要工作如下:(1)概述了通用搜索引擎的发展、分类以及它的结构和工作原理。(2)分析了主题Web搜索的发展现状、研究背景,主题搜索引擎和通用搜索引擎的差异;对主题Web搜索的关键技术和主题网络蜘蛛进行了讨论。(3)分析了网络蜘蛛的Best-First搜索算法,并对算法进行了优化;分析了页面中存在着的动态链接和静态链接等多种链接情况,讨论了在网页中通过对动态链接的解析,更全面的抓取页面中存在的网络链接。(4)基于上述研究,实现了一个主题WEB挖掘系统(TWMS,Topic Web MiningSystem)。给出了系统设计结构图,系统实现的关键技术和方法,并对系统进行了测试。关...
内容来自转载请标明出处.
本文关键词:主题WEB搜索引擎优化与实现研究,由笔耕文化传播整理发布。
本文编号:109146
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/109146.html