当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于Nutch的搜索引擎的研究

发布时间:2017-12-23 05:32

  本文关键词:基于Nutch的搜索引擎的研究 出处:《计算机时代》2007年01期  论文类型:期刊论文


  更多相关文章: Nutch Lucene 中文分词 评分机制


【摘要】:Nutch是一个开放源代码的Web搜索引擎,是以Lucene为基础实现的搜索引擎应用程序,其工作流程和现代的商业搜索引擎工作原理一样,即网页搜集、预处理(建立索引)和查询服务。由于不夹杂商业利益,它对搜索结果的排序算法较为透明公平。我们可以利用Nutch并结合中文分词技术来构建自己的中文搜索引擎。
【作者单位】: 北京交通大学计算机与信息技术学院 北京交通大学计算机与信息技术学院
【分类号】:TP391.3
【正文快照】: 0引言随着计算机与互联网的日益普及与应用,在10年左右的时间里互联网上至少产生了50亿的网页,浩如烟海的互联网信息极大地促进了搜索引擎技术的蓬勃发展,诞生了我们熟知的Google、Yahoo、百度等一大批搜索引擎。据CNNIC统计,搜索引擎已成为继电子邮件之后的第二大Web应用。

【共引文献】

相关期刊论文 前5条

1 陈艳春;李双平;;基于Lucene的企业级搜索引擎的设计与实现[J];现代图书情报技术;2007年08期

2 许军林;蒋年德;;基于Ajax的Web应用研究[J];现代计算机;2007年04期

3 潘以锋;;基于Lucene的网站全文检索系统的开发[J];广西教育学院学报;2006年05期

4 吴发辉;;Ajax技术初探[J];南平师专学报;2006年04期

5 李占波;廖继东;李华;;基于DotLucene的垂直搜索引擎的研究[J];微计算机信息;2007年24期

相关会议论文 前2条

1 王富强;马德涛;张立朝;王建明;;地方志数据库全文信息检索研究[A];中国地理信息系统协会第四次会员代表大会暨第十一届年会论文集[C];2007年

2 李应兴;付婷;李勇;;基于LUCENE的藏文信息检索的研究与应用[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年

相关硕士学位论文 前10条

1 吕昊;面向垂直搜索的聚焦爬虫研究及应用[D];浙江大学;2008年

2 齐波;基于短语识别的自然语言理解搜索方法研究[D];重庆大学;2007年

3 柴春轶;基于Ajax理论的服务器端控件(SCBA)的开发与使用[D];上海师范大学;2007年

4 卢毓亮;面向Web站点的搜索引擎研究与实现[D];西安理工大学;2007年

5 孙赛赛;基于JXTA的P2P搜索引擎研究与实现[D];山东科技大学;2007年

6 范小源;搜索引擎系统网页消重的研究与实现[D];中南民族大学;2007年

7 董祥千;搜索引擎设计分析与结果聚类改进[D];电子科技大学;2007年

8 黄杰;基于Lucene的全文检索系统模型的研究[D];暨南大学;2007年

9 李渊;面向异步通讯机制的网页搜索技术研究[D];浙江工商大学;2007年

10 蒋建洪;基于分布式的搜索引擎框架研究和实现[D];西北工业大学;2007年

【相似文献】

相关期刊论文 前5条

1 胡涛;路红英;;基于Nutch的搜索引擎的研究[J];计算机时代;2007年01期

2 申晋;;基于Lucene和Nutch的林业垂直搜索引擎的研建[J];农业网络信息;2008年04期

3 蔡小艳;寇应展;沈巍;郑伟;;Nutch-0.9中JE中文分词的实现[J];科学技术与工程;2008年17期

4 高飞;刘云;;Nutch中文分词方法的实现[J];网络安全技术与应用;2008年09期

5 刘高原;张国平;;基于Nutch的搜索引擎技术[J];平顶山学院学报;2008年05期

相关硕士学位论文 前1条

1 叶勤勇;基于URL规则的聚焦爬虫及其应用[D];浙江大学;2007年



本文编号:1322633

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1322633.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户47d16***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com