当前位置:主页 > 科技论文 > 搜索引擎论文 >

高效FTP搜索引擎的设计与实现

发布时间:2018-05-05 21:41

  本文选题:文件传输协议 + 搜索引擎 ; 参考:《华南理工大学学报(自然科学版)》2009年01期


【摘要】:为了解决传统FTP搜索引擎对检索结果优化程度不够而造成的检索质量低的问题,在对FTP用户查询日志进行统计分析的基础上,采用双字节倒排索引、检索结果自动分类以及查询自动纠错等技术设计了一种高性能的智能化FTP搜索引擎.双字节倒排是对文件名中每两个字节建立倒排索引表,自动分类是对检索结果按主题划分为层次结构,查询自动纠错是以用户查询日志中的高频查询词为数据源构建拼写错误词典.试验结果表明,该方案能够有效地提高FTP搜索引擎的文件检索效率与质量.
[Abstract]:In order to solve the problem of low retrieval quality caused by the poor optimization of search results caused by the traditional FTP search engine, based on the statistical analysis of the query logs of FTP users, a double-byte inverted index is adopted. A high performance intelligent FTP search engine is designed by automatic classification of retrieval results and automatic error correction of query. Double-byte inversion is to create an inverted index table for every two bytes in the file name. The automatic classification is to divide the retrieval results into hierarchies according to the topic. Query automatic error correction is to construct spelling error dictionary based on high frequency query words in user query log. The experimental results show that this scheme can effectively improve the efficiency and quality of FTP search engine file retrieval.
【作者单位】: 中国农业大学工学院;国家农业信息化工程技术研究中心;
【基金】:国家“863”计划项目(2006AA10Z239) 国家科技支撑计划项目(2006BAH02A16)
【分类号】:TP391.3

【共引文献】

相关期刊论文 前6条

1 李艳梅;图书馆FTP服务器的建立和安全分析[J];安徽大学学报(自然科学版);2005年03期

2 周燕;网络信息资源组织研究[J];图书与情报;2003年01期

3 赵旭;陈肖飞;;基于Web的高校FTP搜索引擎的技术研究[J];电脑知识与技术(学术交流);2007年22期

4 席生长;胡宏涛;;信息检索技术在中石油勘探与生产分公司门户内的应用研究[J];福建电脑;2008年01期

5 易清亮;刘克剑;蔡祖恋;;基于P2P技术的大型分布式FTP搜索引擎研究[J];广西师范大学学报(自然科学版);2010年01期

6 许昊;王跃胜;;基于Lucene的FTP搜索引擎的设计与实现[J];福建电脑;2012年07期

相关博士学位论文 前2条

1 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年

2 张永晖;基于用户行为的下一代移动互联网络若干关键问题的研究[D];中南大学;2010年

相关硕士学位论文 前10条

1 兰冲;基于统计规则的中文分词研究[D];西安电子科技大学;2011年

2 刘治华;面向主题的文档摘要技术研究[D];北方工业大学;2011年

3 轩春青;基于客户反馈的FTP搜索引擎的研究与设计[D];郑州大学;2011年

4 仇亚东;面向农业领域的垂直搜索技术的研究[D];南京农业大学;2010年

5 李东伟;移动互联网环境下无线垂直搜索引擎的研究与实现[D];电子科技大学;2011年

6 余舟华;基于陷阱的spider检测评价模型研究[D];沈阳航空航天大学;2011年

7 黄素珍;并行多元搜索引擎的研究与设计[D];广西大学;2001年

8 李建平;智能化WEB信息搜索引擎的研究与实现[D];大庆石油学院;2003年

9 薛云;Internet上元搜索引擎的研究与设计[D];太原理工大学;2003年

10 陈先;智能搜索引擎关键技术研究与实现[D];哈尔滨工程大学;2003年

【相似文献】

相关期刊论文 前10条

1 黄少林;王华;张玉红;蒋一峰;;基于Lucene的索引系统的设计与实现[J];现代情报;2009年07期

2 王涛;吴洁明;;搜索引擎建立倒排索引的算法研究[J];现代计算机(专业版);2008年01期

3 王路芳;张虎;;一种面向搜索引擎的基于集合模型的搜索算法[J];山西农业大学学报(自然科学版);2009年06期

4 方冰;张一中;;高性能FTP搜索引擎的设计[J];南京邮电大学学报(自然科学版);2007年03期

5 李栋;史晓东;;一种支持高效检索的实时更新倒排索引策略[J];情报学报;2006年01期

6 赵丽红;维尼拉·木沙江;;维、哈、柯多语种搜索引擎中改进索引创建的新方法的构思[J];现代计算机;2011年06期

7 吴文娟;车明;;搜索引擎倒排索引技术的改进[J];微处理机;2006年06期

8 李晓明;单栋栋;;基于文档重要度的静态索引剪枝方法[J];华南理工大学学报(自然科学版);2011年04期

9 匡振国;倪宏;嵇智辉;刘磊;;一种基于Lucene的影片搜索引擎的研究和应用[J];计算机工程与应用;2008年29期

10 易清亮;刘克剑;蔡祖恋;;基于P2P技术的大型分布式FTP搜索引擎研究[J];广西师范大学学报(自然科学版);2010年01期

相关会议论文 前10条

1 维尼拉·木沙江;吴俊森;吐尔根·依布拉音;;维吾尔文搜索引擎的倒排索引设计与实现[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年

2 孙宇;刘憬;张宇;刘挺;;基于分词和倒排索引的短文本检索技术的研究与实现[A];黑龙江省计算机学会2007年学术交流年会论文集[C];2007年

3 彭轲;廖闻剑;;浅析搜索引擎[A];中国通信学会第五届学术年会论文集[C];2008年

4 李丹;;如何利用搜索引擎查找中医药信息[A];中国中医药信息研究会第二届理事大会暨学术交流会议论文汇编[C];2003年

5 李栋;史晓东;;对搜索引擎中倒排索引更新策略的研究和改进[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年

6 邓长寿;郭景峰;杨焱林;邓安远;;下一代Web搜索引擎初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年

7 维尼拉·木沙江;吐尔洪·吾司曼;;维、哈、柯文搜索引擎中网页爬行器的设计与实现[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年

8 汤薇;曾艳;;构建校园网搜索引擎必要性分析[A];广西计算机学会2008年年会论文集[C];2008年

9 姚树宇;赵少东;;一种使用分布式技术的搜索引擎[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年

10 倪俊峰;;基于黄页搜索引擎的关键字排名广告系统的设计与实现[A];2005年中国索引学会年会暨学术研讨会论文集[C];2005年

相关重要报纸文章 前10条

1 李一鑫;搜索排名的红与黑[N];财经时报;2007年

2 周文林;搜狗3.0能否撼动搜索市场[N];经济参考报;2007年

3 惠正一;比尔·盖茨:微软不怕Google[N];第一财经日报;2005年

4 赛迪顾问股份有限公司互联网与电子商务咨询中心 常燕杰;搜索,还是门户[N];中国计算机报;2005年

5 陈珊;浙江移动推出手机搜索引擎服务[N];人民邮电;2005年

6 赵法忠;搜索引擎还需悠着点[N];中国经营报;2005年

7 金朝力;搜索引擎火拼搜索质量[N];北京商报;2006年

8 本报记者  赵晓辉 孟昭丽;搜索引擎驶入“避风港”[N];中国证券报;2006年

9 孙t;搜索引擎惊喜侵权官司止于“避风港”?[N];第一财经日报;2006年

10 姜蕊;问天下谁识搜索?[N];中国高新技术产业导报;2006年

相关博士学位论文 前10条

1 李群;主题搜索引擎聚类算法的研究[D];北京林业大学;2011年

2 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年

3 岑荣伟;基于用户行为分析的搜索引擎评价研究[D];清华大学;2010年

4 苏君华;面向搜索引擎的技术接受模型研究[D];南京大学;2011年

5 刘佐达;分布协作式搜索引擎模型及算法研究[D];清华大学;2011年

6 郭眈;中文互联网视频搜索引擎系统策略研究[D];北京交通大学;2012年

7 王昤璞;基于用户体验的互联网搜索引擎医学信息检索可用性评估研究[D];吉林大学;2010年

8 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年

9 白玉琪;空间信息搜索引擎研究[D];中国科学院研究生院(遥感应用研究所);2003年

10 费巍;搜索引擎检索功能的性能评价研究[D];武汉大学;2010年

相关硕士学位论文 前10条

1 吴俊森;维哈柯多语种搜索引擎倒排索引模块的实现[D];新疆大学;2007年

2 封俊;基于Hadoop的分布式搜索引擎研究与实现[D];太原理工大学;2010年

3 尉建兴;基于Lucene搜索引擎的研究与应用[D];太原理工大学;2011年

4 王珍;维、哈、柯文搜索引擎中的自动分类技术研究[D];新疆大学;2010年

5 刘雪芹;单汉字全文检索技术研究[D];河北工业大学;2005年

6 王颖;中文局域网搜索引擎设计与实现[D];电子科技大学;2009年

7 吴宝贵;搜索引擎中索引技术研究与实现[D];西安电子科技大学;2008年

8 薛云;Internet上元搜索引擎的研究与设计[D];太原理工大学;2003年

9 胡晓翠;站点搜索引擎的研究与实现[D];武汉科技大学;2009年

10 王春花;基于Nutch的农业搜索引擎检索结果排序策略的研究[D];西北农林科技大学;2010年



本文编号:1849408

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1849408.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4bd1b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com