当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于Lucene的应用系统内部搜索的研究与设计

发布时间:2019-12-06 05:48
【摘要】:随着互联网的普及以及数字信息的爆炸式增长,人们已经可以足不出户地接触到海量信息。随着数据量的日益剧增,迫切需要采用全新的、更为动态化的方法来查找所需要的信息。尽管可以对数据进行分门别类,但从成千上万的类别或者子类别中查找信息已经不再是一种行之有效的方法。 像百度、Google这些大型专业的搜索引擎更多的只是满足人们对于网络信息的需求,无法做到对于某个特定的应用系统的全面检索。而利用Lucene技术,可以为任意一个应用系统添加一个专属于其自身的搜索引擎。此外,借助于第三方软件,不仅可以搜索到网页信息,甚至还能搜索到系统内部的数据文档信息(txt、Word、Excel、 PDF、ppt等)和数据库中的数据信息。 本文将从介绍Lucene的原理出发,重点分析其构建索引、排序评分指标和中文分词的原理和应用,并利用Lucene完成各种文档在Web环境下的索引和搜索设计。然后介绍Lucene的Compass框架,并结合目前Web开发中最流行的ssh (spring+struts2+hibernate)架构进行整合,成功构建一个应用系统内部的搜索引擎,并展示其应用于“无锡感知中国博览园智能交通子集模块”当中的效果。 最后,对应用系统内部搜索的工作情况和性能指标做一个简单客观的评价,指出可取和不足之处,并引出以后需要继续努力的方向。
【学位授予单位】:南京理工大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP391.3

【参考文献】

相关期刊论文 前10条

1 费洪晓,康松林,朱小娟,谢文彪;基于词频统计的中文分词的研究[J];计算机工程与应用;2005年07期

2 曹元大,贺海军,涂哲明,王琴;全文检索字索引技术的研究与实现[J];计算机工程;2002年06期

3 赵珂;逯鹏;李永强;;基于Lucene的搜索引擎设计与实现[J];计算机工程;2011年16期

4 陈忱;;Lucene排序算法的个性化改进[J];科技与企业;2012年02期

5 李庆虎,陈玉健,孙家广;一种中文分词词典新机制——双字哈希机制[J];中文信息学报;2003年04期

6 杨晓军;王一莉;;基于Compass的全文检索系统的研究与设计[J];煤炭技术;2010年06期

7 朱勇士;;Compass在SSH架构项目中的应用[J];金融科技时代;2012年06期

8 文继军,王珊;SEEKER:基于关键词的关系数据库信息检索[J];软件学报;2005年07期

9 雷强;李雪山;;基于Compass的铁路科研管理信息系统站内搜索引擎的实现[J];铁路计算机应用;2012年03期

10 彭焕峰;;基于Lucene的中文分词器的设计与实现[J];微型机与应用;2011年18期

相关硕士学位论文 前10条

1 肖露;Spring框架研究与应用[D];长沙理工大学;2011年

2 孙盛兰;基于HIBERNATE的JAVA对象持久化[D];天津大学;2006年

3 全俊林;面向OA系统的个性化搜索引擎设计与实现[D];武汉理工大学;2007年

4 胡长春;基于Lucene的中文自然语言搜索引擎[D];上海交通大学;2009年

5 马楠;基于Spring的J2EE安全框架的研究与应用[D];北京交通大学;2009年

6 王波;基于Lucene的企业搜索引擎[D];北京邮电大学;2009年

7 赵炳森;基于Hibernate的人事管理系统[D];华东师范大学;2009年

8 范t琨;基于Struts2的高校信息平台的构建[D];复旦大学;2009年

9 房芹芹;基于Struts2+Spring框架的教授主页设计与实现[D];中国地质大学(北京);2010年

10 苏景春;基于Lucene的全文检索系统的研究与应用[D];北京交通大学;2010年



本文编号:2570268

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2570268.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d747a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com