基于Lucene2.0和Heritrix搜索引擎的应用研究
本文关键词:基于Lucene2.0和Heritrix搜索引擎的应用研究
更多相关文章: 搜索引擎 网络爬虫 Lucene软件 Heritrix程序 Java语言
【摘要】:基于Lucene2.0和Heritrix的搜索引擎是以广东技术师范学院天河学院为对象构建的,着重开发一个简单的网络垂直搜索引擎,实现一个简单的搜索引擎所具备的基本功能,为今后搭建一个标准的、实用的、商业化的搜索引擎打下坚实的基础。
【作者单位】: 广东技术师范学院天河学院计算机科学与技术系;
【关键词】: 搜索引擎 网络爬虫 Lucene软件 Heritrix程序 Java语言
【分类号】:TP391.3
【正文快照】: 1引言英特网上的信息浩瀚万千,而且毫无秩序,所有的信息像汪洋上的一个个小岛,网页链接是这些小岛之间纵横交错的桥梁,而搜索引擎,则为其绘制一幅一目了然的信息地图,供随时查阅。搜索引擎是指自动从英特网搜集信息,经过一定整理以后,提供给用户进行查询的系统。搜索引擎的工
【参考文献】
中国期刊全文数据库 前2条
1 沈文勤,李庆超,邵志清;搜索引擎的渐增式爬行和备份式更新模式[J];华东理工大学学报;2004年03期
2 何咏梅;毛云舸;;搜索引擎的发展现状与趋势研究[J];吉林省经济管理干部学院学报;2007年04期
【共引文献】
中国期刊全文数据库 前10条
1 徐晓力;;SEO及其策略研究[J];电脑知识与技术;2010年01期
2 周巍巍;;网络爬虫网页库智能更新策略分析与研究[J];电脑知识与技术;2010年31期
3 周少波;;基于Lucene2.0和Heritrix搜索引擎的应用研究[J];电脑编程技巧与维护;2013年16期
4 刘喜文;郑昌兴;王文龙;汤刚强;;构建数据仓库过程中的数据清洗研究[J];图书与情报;2013年05期
5 潘善亮;茅琴娇;韩露;;一种基于虚拟社交化的Web服务发现方法研究[J];电信科学;2013年12期
6 顾益军;解易;张培晶;;面向有组织犯罪分析的人际关系网络节点重要性评价研究[J];中国人民公安大学学报(自然科学版);2013年04期
7 郑晶;;基于云计算的Pagerank算法的改进[J];福州大学学报(自然科学版);2014年01期
8 "基于大数据的互联网化存量经营"项目组;"基于用户感知的运维转型"项目组;;运营商存量经营大数据平台及其关键技术研究[J];电信科学;2014年06期
9 张喜平;李永树;刘刚;王蕾;;节点重要度贡献的复杂网络节点重要度评估方法[J];复杂系统与复杂性科学;2014年03期
10 龚卫华;郭伟鹏;杨良怀;;信任网络中多维信任序列模式挖掘方法研究[J];电子与信息学报;2014年08期
中国博士学位论文全文数据库 前10条
1 刘馨月;Web挖掘中的链接分析与话题检测研究[D];大连理工大学;2012年
2 马飞;云数据中心中虚拟机放置和实时迁移研究[D];北京交通大学;2013年
3 乐承毅;企业知识与员工知识贡献度集成评价方法及应用研究[D];浙江大学;2013年
4 孙甲申;基于主题模型和随机游走的标签技术研究[D];北京邮电大学;2013年
5 张鹏;数据中心网络的流量管理和优化问题研究[D];北京邮电大学;2013年
6 龚书;抽取式多文档文摘的文本表示研究[D];北京交通大学;2013年
7 尹莉;基础数学领域作者合作网络实证分析[D];西北大学;2013年
8 李朋;异构信息网络分析模型及其应用研究[D];重庆大学;2013年
9 程辉;网络用户偏好分析及话题趋势预测方法研究[D];北京交通大学;2013年
10 汤希玮;基于多生物信息的蛋白质网络研究[D];中南大学;2013年
中国硕士学位论文全文数据库 前10条
1 郭海燕;搜索引擎中网络爬虫技术研究[D];西安电子科技大学;2009年
2 程涛;个性化网络信息采集处理系统的设计与实现[D];北京邮电大学;2011年
3 杨颂;面向电子商务网站的增量爬虫设计与实现[D];湖南大学;2010年
4 姜杰;专业搜索引擎分布式Robot设计研究[D];南京师范大学;2005年
5 赵钦;并行爬行器的架构与优化策略[D];北京工业大学;2006年
6 张维维;搜索引擎的研究与实现[D];长春理工大学;2008年
7 仰景岗;在线关键字广告最优竞价策略效果及预算的影响研究[D];上海交通大学;2008年
8 魏春燕;基础教育多媒体网络教学资源检索研究[D];山东师范大学;2008年
9 王国才;基于本体的微内容聚合与查询技术[D];合肥工业大学;2009年
10 易显;搜索引擎中大型网站的网页更新策略研究[D];湖南大学;2010年
【二级参考文献】
中国期刊全文数据库 前1条
1 曹玉霞;搜索引擎新思维[J];现代图书情报技术;2000年05期
【相似文献】
中国期刊全文数据库 前1条
1 熊定富;;基于开源Lucene2.0的书目搜索引擎设计与实现[J];图书情报知识;2009年04期
中国硕士学位论文全文数据库 前1条
1 罗玫;基于LUCENE2.0的源代码搜索引擎架构的实现[D];西北工业大学;2007年
,本文编号:811171
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/811171.html