全文搜索引擎e_Guide的设计与实现
本文关键词:全文搜索引擎e_Guide的设计与实现,,由笔耕文化传播整理发布。
【摘要】:面对互联网信息量爆炸式的增长,人们对搜索引擎的需求和依赖越来越强,因此对搜索引擎技术的研究具有非常重要的理论意义和实用价值。本文描述全文搜索引擎e_Guide的设计和实现。e_Guide是基于Apache Lucene项目及其子项目Nutch和Hadoop的搜索引擎,致力于向用户提供高质量的信息检索服务。整个系统主要分为信息获取模块,信息整理模块,和搜索服务模块。使用Nutch获取网页信息,用Lucene API进行信息索引和检索,同时使用AJAX实现浏览器服务器之间的异步交互。
【作者单位】: 德州学院信息管理学院;
【关键词】: 搜索引擎 信息检索 AJAX 异步交互
【分类号】:TP391.3
【正文快照】: 1、全文搜索引擎概述搜索引擎是随着Web信息的迅速增加,从1995年开始逐渐发展起来的技术。它在互联网中提供导航服务,该服务已经成为互联网上非常重要的网络服务。全文搜索引擎从互联网提取各个网站的信息(以网页文字为主),建立起数据库,并能向用户提供查询检索服务。在众多
【参考文献】
中国期刊全文数据库 前2条
1 张巍,李志蜀;基于PageRank算法的搜索引擎优化策略[J];计算机应用;2005年07期
2 欧阳柳波,李学勇,李国徽,王鑫;网络蜘蛛搜索策略进展研究[J];小型微型计算机系统;2005年04期
中国硕士学位论文全文数据库 前1条
1 苏旋;分布式网络爬虫技术的研究与实现[D];哈尔滨工业大学;2006年
【共引文献】
中国期刊全文数据库 前10条
1 郑志波;;搜索器的设计与实现[J];电脑知识与技术(学术交流);2007年01期
2 张丽敏;;垂直搜索引擎的主题爬虫策略[J];电脑知识与技术;2010年15期
3 赵颖斯;刘云;;BBS舆情系统的数据采集方法[J];电信快报;2008年12期
4 徐英;;面向搜索引擎优化的网站建设方法浅析[J];福建电脑;2011年10期
5 刘东鑫;周斯宁;沈军;;互联网不良信息治理的研究与探讨[J];广东通信技术;2010年12期
6 刘继红;吴军华;任明鑫;;基于改进的网络蜘蛛算法抽取Web站点结构的方法[J];江南大学学报(自然科学版);2009年05期
7 谭龙江;;基于搜索引擎优化的网络宣传机模型[J];计算机应用;2010年08期
8 梁党卫;彭文滔;边利亚;;垂直搜索引擎中过滤器的设计与实现[J];计算机应用与软件;2009年12期
9 闵惜琳;朱展发;;面向“百度”搜索引擎优化算法应用规律分析[J];价值工程;2012年14期
10 李向阳;李铮;;基于Struts和Hibernate框架的比价网设计与实现[J];龙岩学院学报;2007年06期
中国博士学位论文全文数据库 前1条
1 王亮;基于胞映射的数字控制系统量化效应分析与设计[D];华中科技大学;2008年
中国硕士学位论文全文数据库 前10条
1 周兵;基于分布式精准采集的垂直搜索引擎的研究与实现[D];北京邮电大学;2011年
2 连惠杰;基于主题的教育信息定向采集系统[D];南京理工大学;2011年
3 王甲坤;基于互联网的话题分类及敏感话题发现技术研究与实现[D];电子科技大学;2011年
4 卢凡;基于领域本体的主题爬虫系统研究与实现[D];电子科技大学;2011年
5 杨哲;基于Groovy的分布式网络爬虫系统的设计与实现[D];西南交通大学;2010年
6 唐华姣;主题搜索引擎索引技术的研究与实现[D];重庆交通大学;2011年
7 汪明强;基于JAVA+LUCENE+HERITRIX的WEB垂直搜索引擎技术研究与实现[D];河北工业大学;2011年
8 李海波;基于MapReduce框架的分布式网络爬行器研究[D];哈尔滨工程大学;2011年
9 徐涛;基于社会网络分析的藏文web链接结构研究[D];西北民族大学;2011年
10 冯振明;分块式PageRank收敛算法及其改进[D];河海大学;2006年
【二级参考文献】
中国期刊全文数据库 前4条
1 文坤梅,卢正鼎,叶卫国,金莉;搜索引擎中页面更新策略的分析与改进[J];华中科技大学学报(自然科学版);2002年12期
2 王继民;国内综合性搜索引擎时新性的计算[J];计算机工程与应用;2003年21期
3 潘春华 ,常敏 ,武港山;面向Web的信息收集工具的设计与开发[J];计算机应用研究;2002年06期
4 冉晓e
本文编号:456955
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/456955.html