当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于Lucene的Ftp搜索引擎的设计

发布时间:2018-01-19 04:19

  本文关键词: Ftp搜索引擎 Lucene XML 分词 出处:《图书情报工作》2006年04期  论文类型:期刊论文


【摘要】:针对当前网络中所使用的基于数据库的Ftp搜索引擎没有标准资源文档且不支持中文分词和动态数据更新的缺陷,提出基于Lucene这个功能强大的全文索引引擎工具包的Ftp搜索引擎的设计方案。此Ftp搜索引擎不仅能够自动生成标准格式的XML资源文档,而且采用基于字典的前向最大匹配中文分词法在Lucene中动态更新全文索引。该设计还能够对检索关键字进行中英文混合分析和检索。
[Abstract]:The Ftp search engine based on database used in the current network has no standard resource document and does not support Chinese word segmentation and dynamic data update. The design scheme of Ftp search engine based on Lucene, a powerful full-text index engine toolkit, is proposed. This Ftp search engine can not only automatically generate standard format XML resource documents. Furthermore, the full-text index is dynamically updated in Lucene by using the dictionary based maximum matching Chinese word segmentation method. The design can also analyze and retrieve the keywords in both Chinese and English.
【作者单位】: 华中科技大学图书馆 华中科技大学控制科学与工程系 华中科技大学控制科学与工程系
【分类号】:G354
【正文快照】: Ftp服务器是Interaaet上所使用的最主要的服务器之一,因此在Ftp服务器上保存有大量的共享软件、技术资料和多媒体数据等各种文件。每个Ftp服务器都有若干个目录,且其目录和文件结构比较复杂,所以要在Ftp服务器上找到用户所需要的文件并不是一件容易的事情,若要在多个Ftp服务

【参考文献】

相关期刊论文 前5条

1 张运凯,刘宏忠,郭宏刚;FTP搜索引擎的设计与实现[J];河北师范大学学报;2005年01期

2 赵汀,孟祥武;基于LUCENEAPI的中文全文数据库设计与实现[J];计算机工程与应用;2003年20期

3 张汛涞;搜索引擎的设计剖析[J];计算机工程与科学;2002年04期

4 吴栋,滕育平;中文信息检索引擎中的分词与检索技术[J];计算机应用;2004年07期

5 高琰,谷士文,谭立球,费耀平;基于Lucene的搜索引擎设计与实现[J];微机发展;2004年10期

【共引文献】

相关期刊论文 前10条

1 王正;陆余良;刘金红;施凡;;基于Lucene的互联网文献信息检索系统的研究[J];安徽大学学报(自然科学版);2009年05期

2 孙素芬;罗长寿;张峻峰;于峰;张树亮;;农业信息资源整合系统研究与应用[J];安徽农业科学;2007年22期

3 李巍巍;;全文检索引擎工具包Lucene的结构与索引原理的研究[J];才智;2008年09期

4 肖红;刘淑华;;一种文本多级分类方法研究[J];长江大学学报(自然科学版)理工卷;2008年02期

5 谢红薇;王栋;;基于Web文本挖掘中的一种中文分词算法研究[J];电脑开发与应用;2007年07期

6 王利峰;;动态索引树文本聚类方法中节点阀值的优化[J];电脑开发与应用;2010年09期

7 郑志波;;搜索器的设计与实现[J];电脑知识与技术(学术交流);2007年01期

8 周珍娟;张字平;陆玲;;基于Lucene2.0的电子文献全文检索系统[J];电脑知识与技术(学术交流);2007年23期

9 郭屹;;对中文自动分词机制的研究和改进[J];电脑知识与技术;2008年07期

10 刘磊安;符志强;;基于Lucene.net网络爬虫的设计与实现[J];电脑知识与技术;2010年08期

相关会议论文 前5条

1 李明宙;罗艳;王宗义;;Lucene全文检索引擎的研究及应用[A];广西计算机学会2010年学术年会论文集[C];2010年

2 马春雷;;基于向量空间模型的中文文本检索研究[A];2007年河北省电子学会、河北省计算机学会、河北省自动化学会、河北省人工智能学会、河北省计算机辅助设计研究会、河北省软件行业协会联合学术年会论文集[C];2007年

3 王虎;王潜平;;对整词二分自动分词机制的改进[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年

4 张玉连;张敏;张波;;一种无词典分词方法的分析与研究[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年

5 杨喜权;张一鸣;王大勇;;基于特征码的大规模XML文档去重算法研究[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年

相关博士学位论文 前4条

1 杜亚军;搜索引擎智能行为的研究及实现[D];西南交通大学;2005年

2 孙越恒;基于统计的NLP技术在中文信息检索中的应用研究[D];天津大学;2005年

3 姜韶华;科研项目管理中的文本挖掘方法研究及应用[D];大连理工大学;2006年

4 陈家赢;对地观测传感器信息资源建模和管理研究[D];武汉大学;2010年

相关硕士学位论文 前10条

1 刘洋;基于本体的医保审计知识库构建研究[D];哈尔滨工程大学;2010年

2 巫昌凯;企业知识库系统中复杂查询系统的设计与实现[D];华南理工大学;2010年

3 徐德玉;中文文档内容相似度检测方法研究[D];长春工业大学;2010年

4 蔡蕊;一种新的搜索引擎分词词典的研究[D];山东大学;2010年

5 范慧;以博客内容为对象的个性化搜索研究[D];华中科技大学;2010年

6 吴政;面向侨务信息主题的搜索引擎[D];华侨大学;2003年

7 常晓燕;基于Java的新闻搜索引擎的设计与实现[D];西南交通大学;2004年

8 王军;中文搜索引擎的设计与实现[D];华中科技大学;2004年

9 欧歌;专题式Web信息获取技术研究[D];北京化工大学;2005年

10 姜杰;专业搜索引擎分布式Robot设计研究[D];南京师范大学;2005年

【二级参考文献】

相关期刊论文 前3条

1 钟涛,陈新明,万钧,张世永;中文文本WEB搜索引擎的设计与实现[J];计算机工程与应用;2001年17期

2 严威,赵政;开发中文搜索引擎汉语处理的关键技术[J];计算机工程;1999年06期

3 李晓明,刘建国;搜索引擎技术及趋势[J];中国计算机用户;2000年09期

【相似文献】

相关期刊论文 前10条

1 马欢;;XML在电子商务中的应用[J];China's Foreign Trade;2011年14期

2 周拴龙;;Lucene.net中文分词算法分析[J];郑州大学学报(理学版);2011年03期

3 李恒;;元数据管理系统的研究与实现[J];电脑知识与技术;2011年13期

4 谢峰;;双XML模式在异构数据交换中的应用研究[J];黑龙江科技信息;2011年21期

5 刘智琦;徐奕奕;;XML在电子商务中的应用[J];黑龙江科技信息;2011年20期

6 顾锦江;;基于AS技术的计算机网络虚拟实验的开发[J];计算机应用与软件;2011年07期

7 周强;;XML在动态网页中的应用[J];科技传播;2011年15期

8 朱兴统;许波;;一种基于粗糙集理论的XML数据挖掘模型[J];科学技术与工程;2011年20期

9 周长敏;唐型基;;XML技术在考试系统中的应用研究[J];电脑知识与技术;2011年23期

10 陈爱华;;基于XML和Web Service的异构数据库数据交换[J];武汉船舶职业技术学院学报;2011年04期

相关会议论文 前10条

1 郭志懋;周傲英;;XML数据的在线过滤[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年

2 何震瀛;李建中;王宏志;;XML数据的关系存储[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年

3 丁峰;王煜;姚延涛;沈钧毅;;从XML模式到数据库模式[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年

4 谈子敬;施伯乐;;XML导出数据库表的实现与应用[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年

5 罗道峰;孟小峰;;一种面向XML文档的基于角色的扩展访问控制方法[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年

6 郑骏;王焱;钱卫宁;周傲英;;XML相似相关结构库的构造及其应用[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年

7 吴刚;于亚新;王国仁;于戈;;并行XML文档数据分片技术研究[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年

8 王静;孟小峰;王珊;;以目标节点为导向的XML路径查询处理[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年

9 王鹏飞;洪晓光;;基于XML大文档的动态索引[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年

10 肖冰;廖湖声;郑玉明;;数据集成系统中的XML延迟处理技术[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年

相关重要报纸文章 前10条

1 北京大学计算机科学技术系 陈华 李晓明;国内外FTP搜索引擎比较[N];计算机世界;2002年

2 秦林;《XML完全探索》[N];中华读书报;2001年

3 本报记者 李瀛寰;XML推了网络一把[N];中国计算机报;2000年

4 ;分化并不能阻止XML发展[N];中国计算机报;2000年

5 ;为XML标准定标准[N];中国计算机报;2001年

6 IDG电讯;Microsoft、IBM共同制定XML标准[N];计算机世界;2000年

7 北京邮电大学 张剑;XML与HTML的结合(上)[N];计算机世界;2001年

8 本报记者 陆 杰;XML丛林的新秀[N];中华读书报;2002年

9 北京邮电大学 张剑;XML技术预览[N];计算机世界;2001年

10 北京邮电大学 张剑;XML与HTML的结合(下)[N];计算机世界;2001年

相关博士学位论文 前10条

1 沈洁;基于自动机的XML数据过滤研究[D];哈尔滨工程大学;2010年

2 殷丽凤;不完全信息环境下XML数据库规范化问题的研究[D];哈尔滨理工大学;2009年

3 叶晓峰;基于XML的冲压模具设计知识重用技术研究[D];华中科技大学;2010年

4 张晨静;XML关键字过滤技术[D];复旦大学;2011年

5 汪源;XML事务模型及并发控制研究[D];浙江大学;2006年

6 许建军;对结构化和半结构化数据的关键字搜索研究[D];复旦大学;2007年

7 刘喜平;XML文档搜索中的查询处理技术研究[D];江西财经大学;2010年

8 李荷华;面向智能体的化工过程运行系统信息集成模型研究[D];华南理工大学;2003年

9 朱晓冬;数字博物馆关键技术研究[D];西北大学;2004年

10 陈廷斌;基于XML/Web服务的供应链信息集成技术与方法研究[D];大连理工大学;2005年

相关硕士学位论文 前10条

1 赵善明;基于Lucene的主题搜索引擎研究[D];西安电子科技大学;2008年

2 王冬坡;基于Lucene的主题搜索引擎的研究与实现[D];河北科技大学;2010年

3 刘莺迎;基于lucene中文全文检索系统的研究与实现[D];郑州大学;2009年

4 张彬;基于lucene的搜索引擎[D];上海师范大学;2010年

5 高欣;基于Lucene的全文检索系统的研究与实现[D];天津师范大学;2010年

6 吴代文;基于Lucene的二次全文检索系统设计与实现[D];西安电子科技大学;2009年

7 闻峥;基于Lucene的搜索引擎优化[D];北京交通大学;2011年

8 杜先撰;基于Lucene全文索引系统设计与实现[D];南京大学;2011年

9 周月红;基于Lucene的站内搜索引擎的设计与开发[D];华东理工大学;2011年

10 徐财应;基于Lucene的搜索引擎技术的研究与改进[D];长春理工大学;2010年



本文编号:1442603

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1442603.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户bb354***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com