当前位置:主页 > 科技论文 > 搜索引擎论文 >

K-FTP搜索引擎的核心技术

发布时间:2018-03-08 13:02

  本文选题:FTP搜索引擎 切入点:倒排索引 出处:《计算机工程》2008年13期  论文类型:期刊论文


【摘要】:传统FTP搜索引擎对检索结果优化程度不够,会降低检索质量。在FTP用户查询日志的统计分析基础上,采用双字节倒排索引、检索结果自动分类以及查询自动纠错等技术设计了一种高性能的智能化FTP搜索引擎。试验表明该方案能够有效地提高FTP文件检索效率与质量,平均检索响应时间低于500ms,检索准确率为92.5%。
[Abstract]:The traditional FTP search engine is not enough to optimize the retrieval results, which will reduce the retrieval quality. On the basis of the statistical analysis of FTP users' query logs, the two-byte inverted index is adopted. An intelligent FTP search engine with high performance is designed by automatic classification of retrieval results and automatic error correction of query. Experiments show that this scheme can effectively improve the efficiency and quality of FTP file retrieval. The average retrieval response time was less than 500 msand the retrieval accuracy was 92.5 ms.
【作者单位】: 中国农业大学工学院 中国农业大学工学院 中国农业大学工学院 中国农业大学信息电子工程学院 中国农业大学工学院 中国农业大学工学院
【基金】:国家“863”计划基金资助项目(2006AA10Z239) 欧盟亚洲信息技术与通信项目(CN/ASIA-IT&C/005(89099)) 国家科技支撑基金资助项目(2006BAH02A16) 江苏省高校省级重点实验室开放课题基金资助项目
【分类号】:TP393.093

【参考文献】

相关期刊论文 前2条

1 彭波;;大规模搜索引擎检索系统框架与实现要点[J];计算机工程与科学;2006年03期

2 陈华,罗昶,王建勇,段晖,薛明;基于Web的百万级FTP搜索引擎的设计与实现[J];计算机应用;2000年09期

【共引文献】

相关期刊论文 前10条

1 赵旭;陈肖飞;;基于Web的高校FTP搜索引擎的技术研究[J];电脑知识与技术(学术交流);2007年22期

2 席生长;胡宏涛;;信息检索技术在中石油勘探与生产分公司门户内的应用研究[J];福建电脑;2008年01期

3 易清亮;刘克剑;蔡祖恋;;基于P2P技术的大型分布式FTP搜索引擎研究[J];广西师范大学学报(自然科学版);2010年01期

4 许昊;王跃胜;;基于Lucene的FTP搜索引擎的设计与实现[J];福建电脑;2012年07期

5 谢欣,刘菲菲,李晓明;天网千帆——一种新型文件搜索引擎[J];华南理工大学学报(自然科学版);2004年S1期

6 郭立力;赵春江;;高效FTP搜索引擎的设计与实现[J];华南理工大学学报(自然科学版);2009年01期

7 许君;王朝坤;李瑞;王建民;刘璋;;基于内容的分布式FTP搜索引擎的设计与实现[J];计算机研究与发展;2011年S3期

8 周德懋;李舟军;;高性能网络爬虫:研究综述[J];计算机科学;2009年08期

9 蒋维;郝文宁;杨晓恝;靳大尉;;分布式数据库搜索引擎的索引建立和优化[J];计算机工程;2008年18期

10 朱恒亮;蒋建民;肖颖;;基于搜索的信息管理系统[J];计算机与数字工程;2009年09期

相关博士学位论文 前1条

1 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年

相关硕士学位论文 前10条

1 兰冲;基于统计规则的中文分词研究[D];西安电子科技大学;2011年

2 刘治华;面向主题的文档摘要技术研究[D];北方工业大学;2011年

3 轩春青;基于客户反馈的FTP搜索引擎的研究与设计[D];郑州大学;2011年

4 李东伟;移动互联网环境下无线垂直搜索引擎的研究与实现[D];电子科技大学;2011年

5 余舟华;基于陷阱的spider检测评价模型研究[D];沈阳航空航天大学;2011年

6 黄素珍;并行多元搜索引擎的研究与设计[D];广西大学;2001年

7 关峪;基于P2P技术的即时通信系统研究与实现[D];北京交通大学;2007年

8 冯月;基于专业搜索引擎网络蜘蛛搜索策略研究[D];电子科技大学;2007年

9 刘佳;中文搜索引擎的设计与实现[D];东华大学;2008年

10 魏春燕;基础教育多媒体网络教学资源检索研究[D];山东师范大学;2008年

【二级参考文献】

相关期刊论文 前2条

1 王建勇,单松巍,雷鸣,谢正茂,李晓明;海量Web搜索引擎系统中用户行为的分布特征及其启示[J];中国科学E辑:技术科学;2001年04期

2 冯是聪,张志刚,李晓明;一种中文网页自动分类方法的实现及应用[J];计算机工程;2004年05期

【相似文献】

相关期刊论文 前10条

1 郭立力;赵春江;;高效FTP搜索引擎的设计与实现[J];华南理工大学学报(自然科学版);2009年01期

2 赵珂;逯鹏;李永强;;基于Lucene的搜索引擎设计与实现[J];计算机工程;2011年16期

3 万嘉若,章明;教学模式的特征抽取与自动分类[J];信息与控制;1985年01期

4 林平青,王莉;计算机自动分类标引研究(续完)[J];中国中医药信息杂志;1995年10期

5 卢香霄;叶新明;;自动分类与手工分类的比较[J];图书馆杂志;1995年03期

6 尹中航,王永成,蔡巍;应用支持向量机进行网上信息自动分类[J];高技术通讯;2001年11期

7 王荣航;叶文源;;产品零件的自动分类及典型工艺的自动生成[J];机械;1991年04期

8 ;TRS InfoRadar 网络信息雷达[J];中国传媒科技;2004年05期

9 田甜;;文档自动分类的方法探讨[J];情报杂志;2006年02期

10 廖勇;;信息处理及文献自动分类的探讨[J];西南民族大学学报(自然科学版);2008年04期

相关会议论文 前10条

1 刘小珠;孙莎;曾承;彭智勇;;基于缓存的倒排索引机制研究[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年

2 李栋;史晓东;;对搜索引擎中倒排索引更新策略的研究和改进[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年

3 田云飞;李训诰;;基于模糊聚类阈值λ的噪声目标自动分类研究[A];中国声学学会2005年青年学术会议[CYCA'05]论文集[C];2005年

4 董祥千;左志宏;刘强国;;Lucene倒排索引文件的实现与优化[A];四川省通信学会2006年学术年会论文集(二)[C];2006年

5 翟伟斌;许榕生;;基于Internet的CIS研究[A];第十三届全国核电子学与核探测技术学术年会论文集(下册)[C];2006年

6 辛欣;李涓子;;基于Java语言全文信息检索系统的设计与实现[A];促进企业信息化进程——第十届中国Java技术及应用大会文集[C];2007年

7 孙雄勇;罗霄;;中图分类法体系下的自动分类研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

8 何元烈;陈萍;毛宗源;田联房;;基于灰度阈值分割法和灰度均匀法的全身骨图像分析及计算机自动分类[A];第二届全国核素显像及治疗学术会议论文摘要汇编[C];2004年

9 何琳;侯汉清;;基于标引经验和机器学习相结合的多层自动分类[A];2005年中国索引学会年会暨学术研讨会论文集[C];2005年

10 于凤鸣;包玉海;卓义;;BP神经网络在土地覆被分类中的应用研究[A];中国气象学会2007年年会生态气象业务建设与农业气象灾害预警分会场论文集[C];2007年

相关重要报纸文章 前10条

1 北京大学计算机科学技术系 陈华 李晓明;国内外FTP搜索引擎比较[N];计算机世界;2002年

2 胥小红 本报记者  雅梓;下一代搜索轮廓初现Autonomy力挺中文搜索[N];大众科技报;2006年

3 王萍;Web文本的知识化管理[N];计算机世界;2006年

4 飘零雪;FTP资源一网打尽[N];电脑报;2003年

5 赵明;第二代搜索软肋犹在 第三代搜索浮出水面[N];中国经济时报;2006年

6 清华大学计算机系智能技术与系统国家重点实验室 张敏 金奕江;寻“宝”有术[N];计算机世界;2003年

7 张利;下一代搜索轮廓初现Autonomy力挺中文搜[N];中国企业报;2006年

8 易水;IT新词集锦(420)[N];计算机世界;2004年

9 白晓燕;第二代电子商务交易平台“商务搜”正式发布[N];中国高新技术产业导报;2006年

10 叶佳;索尼发布蓝光DVD新机[N];经济参考报;2008年

相关博士学位论文 前10条

1 关欣;音乐信号自动分类相关算法研究[D];天津大学;2009年

2 罗红霞;地学知识辅助遥感进行山地丘陵区基于系统分类标准的土壤自动分类方法研究[D];武汉大学;2005年

3 吴炜;密文全文检索系统中的索引机制研究[D];华中科技大学;2009年

4 章品正;面部表情自动分类的方法与系统研究[D];东南大学;2005年

5 李孟;三维表面数字拼接算法研究[D];哈尔滨工业大学;2009年

6 沈美丽;尿沉渣有形成分自动分类系统研究[D];长春理工大学;2006年

7 龙柏;并行计算平台上的数据索引技术研究[D];中国科学技术大学;2011年

8 邝砾;基于接口和行为语义的Web服务发现与适配研究[D];浙江大学;2009年

9 胥正川;基于关系数据库的XML数据存储、更新和检索[D];复旦大学;2003年

10 朱凌云;移动心电监护系统ECG信号的智能检测与分析方法研究[D];重庆大学;2003年

相关硕士学位论文 前10条

1 孙忠泽;行政立法草案公众意见自动化分类研究[D];复旦大学;2011年

2 董长春;基于Hadoop的倒排索引技术的研究[D];辽宁大学;2011年

3 潘胜一;基于倒排索引的压缩算法性能研究[D];杭州电子科技大学;2009年

4 吴娟;军用信息自动分类的研究与实现[D];南京理工大学;2004年

5 薛煜阳;农业搜索引擎倒排索引缓冲机制研究[D];新疆农业大学;2011年

6 陈波;中文WEB文档自动分类的研究与实现[D];武汉理工大学;2005年

7 柯丽;基于频繁共现熵的跨语言网页自动分类研究[D];江西师范大学;2011年

8 王广超;一种圆金属片自动分类装置的设计[D];西北农林科技大学;2012年

9 吴俊森;维哈柯多语种搜索引擎倒排索引模块的实现[D];新疆大学;2007年

10 盛晓炜;基于粗集理论的中文文本自动分类与检索研究[D];清华大学;2004年



本文编号:1584001

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1584001.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e60b5***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com