国家农业科学数据中心站内搜索引擎技术研究
本文选题:Lucene + 搜索引擎 ; 参考:《中国农学通报》2011年30期
【摘要】:为了解决原有检索技术已经不能满足国家农业科学数据中心检索需求的问题,研究了Lucene这种开源全文检索工具包的原理及使用方法,探讨了利用Lucene工具包在国家农业科学数据中心站内构建海量数据搜索引擎的方法,并在农业科学数据中心网站中选取3个有代表性的大、中、小型数据库,依照上述方法建立了基于Lucene工具包的搜索引擎,以此为基础进行不同大小数据库搜索效率对比实验,最后,将实验结果与传统的数据检索方法在相应数据库搜索时所得到的结果相比较。实验结果表明,基于Lucene的搜索引擎在检索效率上明显占优,实际应用效果也是令人满意的。
[Abstract]:In order to solve the problem that the original retrieval technology can no longer meet the retrieval needs of the National Agricultural Science data Center, this paper studies the principle and use method of Lucene, an open source full-text retrieval toolkit. This paper discusses the method of constructing the massive data search engine in the National Agricultural Science data Center by using the Lucene Toolkit, and selects three representative large, medium and small databases in the website of the Agricultural Science data Center. According to the above method, the search engine based on Lucene Toolkit is established, based on which the search efficiency of different size databases is compared. Finally, The experimental results are compared with those obtained by the traditional data retrieval methods in the corresponding database search. The experimental results show that the search engine based on Lucene is superior in retrieval efficiency and the practical application effect is satisfactory.
【作者单位】: 中国农业科学院农业信息研究所;
【基金】:国家科技重大专项课题“基于TD-SCDMA的农村信息化应用方案开发及示范验证”(2009ZX03001-019)
【分类号】:TP391.3
【参考文献】
相关期刊论文 前10条
1 谢峰;刘洪星;;基于Lucene的Web站内搜索引擎的研究[J];电脑知识与技术;2008年04期
2 张盼;聂刚;;基于Lucene的全文检索系统的设计与实现[J];电脑知识与技术;2010年01期
3 刘磊安;符志强;;基于Lucene.net网络爬虫的设计与实现[J];电脑知识与技术;2010年08期
4 解鹏飞;;Lucene搜索引擎技术在国家海洋数字档案馆示范系统中的实现及应用[J];海洋环境科学;2008年S2期
5 樊景超;周国民;;基于Lucene的“农搜”并行索引技术研究[J];农业网络信息;2009年08期
6 白晓玲;;Lucene全文检索系统的实现及其索引性能的提高[J];情报探索;2010年01期
7 晁岳峰;曹作良;郭英玲;;基于Lucene的搜索引擎在远程教育平台中的实现[J];天津理工大学学报;2005年06期
8 彭哲;陈敬文;;Lucene全文检索的应用及检索效率测试研究[J];图书馆学研究;2009年02期
9 李永春;丁华福;;Lucene的全文检索的研究与应用[J];计算机技术与发展;2010年02期
10 叶云;梁京章;;基于Lucene的搜索引擎在远程教育平台中的应用[J];现代计算机;2007年04期
【共引文献】
相关期刊论文 前10条
1 李敏;黄凯;;一个多线程全文检索系统的构建[J];长江大学学报(自然科学版)理工卷;2010年03期
2 梁叶;梁京章;阳红;叶云;;近似镜像检测算法在文本消重中的应用研究[J];广西大学学报(自然科学版);2010年02期
3 李勇;王移芝;;基于Lucene的网络教学资源检索系统的设计与实现[J];计算机与信息技术;2008年11期
4 龚磊;武友新;;Lucene全文检索系统的研究与实现[J];计算机与数字工程;2010年05期
5 李立;王小磊;赵东升;;生物医学专题信息跟踪与服务系统的设计与实现[J];军事医学科学院院刊;2010年04期
6 李浩;;通用格式的Lucene文档解析器框架的构建[J];计算机与现代化;2011年03期
7 聂琰;;校园网多数据源信息检索系统的设计与实现[J];中国教育信息化;2011年05期
8 孙海东;张力;;基于Lucennee.t的医学教育视频垂直检索的设计与实现[J];开放教育研究;2011年02期
9 贺秀英;;基于信息检索的整合检索系统设计与实现[J];商业时代;2011年14期
10 丁兆贵;金敏;;基于Lucene的个性化搜索引擎研究与实现[J];计算机技术与发展;2011年02期
相关硕士学位论文 前10条
1 董长春;基于Hadoop的倒排索引技术的研究[D];辽宁大学;2011年
2 陈正思;基于TRS信息检索技术的文献资源统一检索平台的构建[D];中南大学;2011年
3 于景茹;基于Lucene的职位垂直搜索引擎的研究与实现[D];郑州大学;2011年
4 孙利芳;基于DSpace的文献仓储库的研究与实现[D];内蒙古大学;2010年
5 王可;基于Nutch的学校信息垂直搜索引擎的研究与实现[D];华东师范大学;2009年
6 何军;基于RFID的开发式门禁系统的设计与实现[D];电子科技大学;2010年
7 曾旭;全文检索引擎应用于邮件的设计与实现[D];电子科技大学;2010年
8 张实磊;数字电视业务信息协议栈设计[D];电子科技大学;2010年
9 阴晓昱;基于Lucene多核并行索引方法的设计与实现[D];上海交通大学;2011年
10 黄卫平;个性化搜索引擎的研究与实现[D];武汉理工大学;2011年
【二级参考文献】
相关期刊论文 前10条
1 陆云;;对基于Java的全文检索工具包lucene的索引研究[J];电脑学习;2007年02期
2 孔伯煊;李祥;;基于Lucene\XML技术的Web搜索引擎设计与实现[J];航空计算技术;2006年04期
3 赵汀,孟祥武;基于LUCENEAPI的中文全文数据库设计与实现[J];计算机工程与应用;2003年20期
4 雷景生,林冬雪,符浅浅;基于改进向量空间模型的Web信息检索技术研究[J];计算机工程;2005年01期
5 郎小伟;王申康;;基于Lucene的全文检索系统研究与开发[J];计算机工程;2006年04期
6 李志蜀,李果;中文搜索引擎的原理剖析及开发实现技术[J];计算机应用研究;2001年11期
7 朱学昊;王儒敬;余锋林;唐昱;;基于Lucene的站内搜索设计与实现[J];计算机应用与软件;2008年10期
8 李庆虎,陈玉健,孙家广;一种中文分词词典新机制——双字哈希机制[J];中文信息学报;2003年04期
9 孙西全;马瑞芳;李燕灵;;基于Lucene的信息检索的研究与应用[J];情报理论与实践;2006年01期
10 刘红;XML文献数据库检索系统的建立与实现[J];情报学报;2003年04期
相关硕士学位论文 前1条
1 宋艳娟;基于XML的HTML和PDF信息抽取技术的研究[D];福州大学;2006年
【相似文献】
相关期刊论文 前10条
1 管建和;甘剑峰;;基于Lucene全文检索引擎的应用研究与实现[J];计算机工程与设计;2007年02期
2 周杨;;基于Lucene的小型搜索引擎系统的架构与实现[J];电脑编程技巧与维护;2010年11期
3 晁岳峰;曹作良;郭英玲;;基于Lucene的搜索引擎在远程教育平台中的实现[J];天津理工大学学报;2005年06期
4 李永春;丁华福;;Lucene的全文检索的研究与应用[J];计算机技术与发展;2010年02期
5 任惠静;;基于Lucene的面向主题搜索引擎的索引技术的研究[J];电脑知识与技术;2010年04期
6 侯云;;构建基于Lucene的网站站内搜索[J];信息与电脑(理论版);2010年02期
7 刘建湘;杨文涛;;基于Lucene的搜索引擎在Struts中的应用[J];软件导刊;2007年03期
8 温艳鸿;;基于lucene的文件搜索引擎的设计与扩展[J];福建电脑;2007年08期
9 周平;;Lucene全文检索引擎技术及应用[J];重庆工学院学报(自然科学版);2007年04期
10 马志强;刘利民;苏依拉;马瑞明;;基于Lucene的站内搜索引擎研究[J];内蒙古工业大学学报(自然科学版);2009年01期
相关会议论文 前10条
1 余珊珊;吴京慧;;个性化搜索引擎中用户兴趣模型的研究和设计[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
2 郭晶;;一个基于汉语分词的搜索引擎原型系统[A];OA’2001办公自动化国际学术研讨会论文集[C];2001年
3 于芳;王大玲;于戈;白旭辉;;搜索引擎中一种基于PLSA的用户模型[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
4 孟红;钟华;;基于htmlparser的搜索引擎信息抽取系统设计与实现[A];第六届全国信息检索学术会议论文集[C];2010年
5 邓长寿;郭景峰;杨焱林;邓安远;;下一代Web搜索引擎初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
6 杨萌;李春丽;朱明;;网络搜索技术下的编辑工作[A];学报编辑论丛(第十一集)[C];2003年
7 陈磊;茹立云;马少平;;基于用户日志挖掘的搜索引擎广告效果分析[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
8 贾彦国;李培德;;Web检索结果聚类算法的改进[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
9 岑荣伟;刘奕群;张敏;茹立云;马少平;;网络搜索引擎用户行为分析和研究[A];第五届全国信息检索学术会议论文集[C];2009年
10 张t$t$;陈华;姜晓宁;;农业电子图书馆在网络搜索引擎冲击下如何发展的几点思考[A];中国农业信息科技创新与学科发展大会论文汇编[C];2007年
相关重要报纸文章 前10条
1 本报记者 朱杰;搜索引擎应用性能分析报告[N];中国计算机报;2009年
2 本报记者 求一兵;国内搜索引擎市场有微变[N];科学时报;2009年
3 记者 李建伟;第4代搜索引擎在郑州问世[N];中国知识产权报;2009年
4 记者 赵志鹏;媒体称俄拟建国家搜索引擎[N];新华每日电讯;2010年
5 记者 李大庆;新型搜索引擎能向用户直接提供所需内容[N];科技日报;2010年
6 深圳大学传播学院、传媒与文化发展研究中心 周裕琼;谁动了我的大脑[N];社会科学报;2010年
7 李大庆;新型搜索引擎直接为用户提供所需内容[N];中国技术市场报;2010年
8 余建斌;搜索引擎市场“烽烟四起”[N];中国高新技术产业导报;2010年
9 迈巴赫 编译;搜索引擎20年[N];计算机世界;2010年
10 记者 秦羽 通讯员 施银峰;全球搜索引擎营销大会在甬举行[N];宁波日报;2010年
相关博士学位论文 前10条
1 岑荣伟;基于用户行为分析的搜索引擎评价研究[D];清华大学;2010年
2 李群;主题搜索引擎聚类算法的研究[D];北京林业大学;2011年
3 苏君华;面向搜索引擎的技术接受模型研究[D];南京大学;2011年
4 白玉琪;空间信息搜索引擎研究[D];中国科学院研究生院(遥感应用研究所);2003年
5 费巍;搜索引擎检索功能的性能评价研究[D];武汉大学;2010年
6 黄河;农业复杂自适应搜索模型研究及实现[D];中国科学技术大学;2010年
7 杜亚军;搜索引擎智能行为的研究及实现[D];西南交通大学;2005年
8 刘东飞;智能双语搜索方法及搜索引擎的研究[D];武汉理工大学;2009年
9 周,
本文编号:1946105
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1946105.html