基于Lucence的搜索引擎原型开发与实现
本文关键词:基于Lucence的搜索引擎原型开发与实现
【摘要】:随着信息技术的高速发展,搜索引擎虽然在搜索方式、搜索速度和搜索范围上有了极大的提高和改善,但是在搜索结果上的相关度上有很大的提升空间。如何让搜索结果的冗余性降低从而提高搜索结果的相关度,让用户想要的结果更加直接,更加清晰的展现在用户的面前已经成为了当今搜索引擎改进的主要方向。本文首先简要介绍了基于因特网的搜索引擎的历史以及相关度的有关研究情况。然后介绍了一个搜索引擎原型系统,此系统获得原始搜索结果,同时利用算法按照相关度进行重新排序,最后将搜索结果列表返回给用户查看。
【作者单位】: 黑龙江省黑河学院计算机科学与信息工程系;
【关键词】: Lucene Nutch 相关度 重新排序
【基金】:黑河学院学生科研项目“‘Search Dog’搜索引擎的研究与开发”(项目编号:XL201101) 黑龙江省教育厅科技类课题“搜索结果的新颖性和并集性研究”子课题(编号:12521361)研究成果
【分类号】:TP391.3
【正文快照】: 一、引言搜索引擎是一款特别的软件系统,能够从互联网上自动搜集信息,并为用户提供插叙服务。搜索引擎对原始文档进行了一系列的整理和处理。用户的查询结果是搜索引擎按照某种规则计算获得的。搜索引擎为网民提供了资源查找和导航的有效手段。Lucene是一个用于全文检索和搜
【共引文献】
中国硕士学位论文全文数据库 前1条
1 孙奇;开放存取期刊站点自动搜索方法研究[D];燕山大学;2012年
【二级参考文献】
中国期刊全文数据库 前2条
1 段淮川;胡平;;基于主题特征和时间因子的改进PageRank算法[J];计算机工程与设计;2010年04期
2 王春花;朱俊平;;改进的非平均传递权值PageRank算法[J];计算机工程与设计;2010年10期
【相似文献】
中国期刊全文数据库 前10条
1 蔡小艳;寇应展;沈巍;郑伟;;Nutch-0.9中JE中文分词的实现[J];科学技术与工程;2008年17期
2 蔡小艳;寇应展;沈巍;郑伟;;汉语词法分析系统ICTCLAS在Nutch-0.9中的应用与实现[J];军械工程学院学报;2008年05期
3 林卉;王一先;朱毅华;;基于Lucene和Nutch的教学资源搜索引擎的研究与实现[J];中国教育信息化;2010年21期
4 胡涛;路红英;;基于Nutch的搜索引擎的研究[J];计算机时代;2007年01期
5 赵德平;刘阳;李鹏;;基于Lucene的房产信息垂直搜索引擎的研究[J];沈阳建筑大学学报(自然科学版);2011年01期
6 吴敏琦;丁岳伟;;应用IP影响因子实现Intranet搜索个性化[J];计算机应用;2008年03期
7 王欢;孙瑞志;;基于领域本体和Lucene的语义检索系统研究[J];计算机应用;2010年06期
8 励子闰;余青松;陈胜东;;基于全文检索引擎的信息检索技术的应用研究[J];计算机与数字工程;2008年09期
9 潘以锋;;基于Lucene的网站全文检索系统的开发[J];广西教育学院学报;2006年05期
10 贺胜;;基于Lucene的中文全文检索系统[J];中国高校科技与产业化;2006年S3期
中国重要会议论文全文数据库 前10条
1 李宇翔;李双红;李茹;;基于社区问答的问题相关度检测研究[A];第六届全国信息检索学术会议论文集[C];2010年
2 李明宙;罗艳;王宗义;;Lucene全文检索引擎的研究及应用[A];广西计算机学会2010年学术年会论文集[C];2010年
3 申兵一;巩青歌;;基于Lucene桌面搜索引擎系统的设计和实现[A];江苏省电子学会2010年学术年会论文集[C];2010年
4 李应兴;付婷;李勇;;基于LUCENE的藏文信息检索的研究与应用[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
5 戴莉;周明全;武仲科;王永恒;王燕妮;周曼;;Lucene在智能答疑系统中的应用研究[A];图像图形技术与应用进展——第三届图像图形技术与应用学术会议论文集[C];2008年
6 梁一平;刘连芳;周小平;申文明;;网络蜘蛛Nutch的分析、定制与二次开发[A];2009年中国高校通信类院系学术研讨会论文集[C];2009年
7 刘寿强;;基于Lucene的分级鉴权企业搜索引擎研究与设计[A];第二十一次全国计算机安全学术交流会论文集[C];2006年
8 苏亮;孙斌;;一种基于Lucene的Hash改进中文分词算法的实现[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
9 王富强;马德涛;张立朝;王建明;;地方志数据库全文信息检索研究[A];中国地理信息系统协会第四次会员代表大会暨第十一届年会论文集[C];2007年
10 汪沛;;Isolex股市预测系统的设计与实现[A];促进企业信息化进程——第十届中国Java技术及应用大会文集[C];2007年
中国重要报纸全文数据库 前9条
1 吴加录;三大搜索引擎仍未满足用户需求[N];中国计算机报;2006年
2 李蓬涛;非结构化视频搜索技术[N];计算机世界;2006年
3 ;微软展示搜索引擎新技术[N];人民邮电;2006年
4 邢小萍;雅虎与微软展开拉锯战[N];网络世界;2008年
5 曹宇杰;业务基础软件平台市场进入快速发展期[N];网络世界;2008年
6 刘小嘉;数字出版:打造出版新架构[N];中国图书商报;2008年
7 孙进;微软“必应”:有限创新如何挑战谷歌?[N];第一财经日报;2009年
8 商报实习记者 李鹏;微软出Bing,,有求必应?[N];中国图书商报;2009年
9 于翔;IE 8正式发布 主打安全与速度[N];网络世界;2009年
中国博士学位论文全文数据库 前10条
1 杨建波;基于多小波及遗传算法的数字水印技术研究[D];吉林大学;2005年
2 曲卫民;中文XML信息检索系统的研究[D];中国科学院研究生院(软件研究所);2004年
3 杨为民;基于场论的信息检索模型的研究[D];安徽大学;2007年
4 洪宇;基于语义结构和时序特征的话题检测与跟踪技术研究[D];哈尔滨工业大学;2009年
5 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年
6 徐前方;基于数据挖掘的网络故障告警相关性研究[D];北京邮电大学;2007年
7 徐剑波;基于本体的电子政务资源管理系统研究[D];东华大学;2007年
8 李强;基于本体论的个性化和社会化元搜索引擎的研究[D];浙江大学;2006年
9 徐晴阳;基于关系子群发现算法的聚焦爬行技术[D];吉林大学;2008年
10 陈叶旺;国家农业本休协同建构与语义检索若干技术研究[D];复旦大学;2009年
中国硕士学位论文全文数据库 前10条
1 王冬坡;基于Lucene的主题搜索引擎的研究与实现[D];河北科技大学;2010年
2 张正龙;基于LUCENE的主题搜索引擎研究与实现[D];重庆大学;2008年
3 岳莉;基于Lucene的全文检索系统的研究与应用[D];西安电子科技大学;2010年
4 胡长春;基于Lucene的中文自然语言搜索引擎[D];上海交通大学;2009年
5 徐海;基于Lucene垂直搜索引擎的研究与实现[D];西安科技大学;2009年
6 李建林;基于Lucene的Web搜索引擎的研究[D];兰州理工大学;2010年
7 张彬;基于lucene的搜索引擎[D];上海师范大学;2010年
8 高欣;基于Lucene的全文检索系统的研究与实现[D];天津师范大学;2010年
9 闻峥;基于Lucene的搜索引擎优化[D];北京交通大学;2011年
10 陈航哲;基于Lucene的垂直搜索引擎的研究与应用[D];暨南大学;2010年
本文编号:818081
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/818081.html