网络搜索引擎的设计与实现
发布时间:2017-10-28 23:31
本文关键词:网络搜索引擎的设计与实现
【摘要】:提出了一个基于Java的全文搜索引擎设计方案,该方案包括基于HTMLParser设计的网络蜘蛛、基于Lucene设计的索引器和检索器3部分。网络蜘蛛采用标签爬行策略和宽度优先遍历算法,实现了对网页的遍历;索引器对网络蜘蛛抓取到的网页创建索引,建立了索引数据库;检索器根据用户输入的关键词对索引数据库进行检索并将检索结果反馈给用户。检索实验证明,该搜索引擎是一个比较高效的检索工具。
【作者单位】: 南阳广播电视大学;
【关键词】: 搜索引擎 网络蜘蛛 索引器 检索器
【分类号】:TP391.3
【正文快照】: 0引言随着互联网技术的飞速发展,互联网中的信息量也越来越大,如何更加有效地利用这些信息资源,已经越来越受到人们的关注。互联网中存在的信息来源十分广泛,与此同时,存在的形式也是多种多样,包括图像、文本、视频、音频等不同的形式,面对着不同来源,不同形式的海量信息,如何
【参考文献】
中国期刊全文数据库 前5条
1 孙宏;李戴维;董旭阳;季泽旭;;搜索引擎技术与发展综述[J];计算机光盘软件与应用;2012年14期
2 李浩;蒋,
本文编号:1110472
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1110472.html