当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于内容的分布式FTP搜索引擎的设计与实现

发布时间:2018-03-13 10:40

  本文选题:分布式计算 切入点:FTP检索 出处:《计算机研究与发展》2011年S3期  论文类型:期刊论文


【摘要】:随着互联网的发展,FTP作为文件共享的主要方式得到了快速的发展.和HTTP相比,FTP具有一些不同的特点,例如区域化、封闭化,这些特点增加了FTP站点的索引与查询工作的难度.目前常见针对FTP文件索引的工作均是围绕文件名开展,用户难以获取到需要的内容信息.iSearch系统作为基于内容的分布式FTP搜索引擎,它能够基于文件内容进行检索,具有增量式索引、可插拔配置、负载均衡、查询分发等特点,同时它通过减少索引过程中的网络传输代价、索引尽可能多的文本信息和充分利用用户的反馈,提供更为准确与稳定的查询服务.
[Abstract]:With the development of the Internet, FTP has been developing rapidly as the main way of file sharing. Compared with HTTP, it has some different characteristics, such as regionalization, closure, etc. These features increase the difficulty of indexing and querying FTP sites. As a distributed FTP search engine based on content, it can be retrieved based on file content. It has the characteristics of incremental index, pluggable configuration, load balancing, query distribution and so on. At the same time, it provides a more accurate and stable query service by reducing the network transmission cost in the indexing process, indexing as much text information as possible and making full use of user feedback.
【作者单位】: 清华大学计算机科学与技术系;清华大学软件学院;清华信息科学与技术国家实验室(筹;清华大学);信息系统安全教育部重点实验室(清华大学);
【基金】:国家自然科学基金项目(60803016,61073005) 清华信息科学与技术国家实验室(筹)学科交叉基金项目 国家核高基科技重大专项基金项目(2010ZX01042-002-002-01)
【分类号】:TP391.3

【参考文献】

相关期刊论文 前1条

1 方冰;张一中;;高性能FTP搜索引擎的设计[J];南京邮电大学学报(自然科学版);2007年03期

【共引文献】

相关期刊论文 前2条

1 谢欣,刘菲菲,李晓明;天网千帆——一种新型文件搜索引擎[J];华南理工大学学报(自然科学版);2004年S1期

2 陈金阳,蒋建中,李晓静,郭军利,张良胜;FTP文件信息采集过滤系统的研究实现[J];信息工程大学学报;2004年04期

相关硕士学位论文 前3条

1 黄素珍;并行多元搜索引擎的研究与设计[D];广西大学;2001年

2 关峪;基于P2P技术的即时通信系统研究与实现[D];北京交通大学;2007年

3 刘佳;中文搜索引擎的设计与实现[D];东华大学;2008年

【二级参考文献】

相关期刊论文 前7条

1 王显芳,杜利民;一种能够检测所有交叉歧义的汉语分词算法[J];电子学报;2004年01期

2 谢欣,刘菲菲,李晓明;天网千帆——一种新型文件搜索引擎[J];华南理工大学学报(自然科学版);2004年S1期

3 陈华,王继民,韩近强,谢欣;互联网上FTP文件的分布特征及启示[J];计算机工程与应用;2004年01期

4 彭波;;大规模搜索引擎检索系统框架与实现要点[J];计算机工程与科学;2006年03期

5 吴栋,滕育平;中文信息检索引擎中的分词与检索技术[J];计算机应用;2004年07期

6 陈玮,陈玉鹏,石晶,陆达;一种高效的全文检索索引技术[J];计算机应用研究;2004年07期

7 皮鹏,张国印;智能元搜索引擎的研究[J];应用科技;2001年08期

【相似文献】

相关期刊论文 前10条

1 陈辉林;陈伟;王爱国;关春喜;;中间件软件开发构架探讨[J];工业设计;2011年05期

2 华翔;康凤举;;一种分布式的电磁场可视化叠加法[J];西安邮电学院学报;2011年04期

3 李静;高正红;黄江涛;赵轲;;基于分布式粒子群算法的翼型优化设计[J];空气动力学学报;2011年04期

4 杨爱军;王红艳;;分布式雷达产品生成系统设计[J];山东农业大学学报(自然科学版);2011年04期

5 金欣;王晶;沈奇威;;分布式最小生成树聚类的设计与实现[J];计算机系统应用;2011年07期

6 ;2011年选题方向和重点栏目组稿内容[J];计算机应用;2011年08期

7 ;2011年选题方向和重点栏目组稿内容[J];计算机应用;2011年S1期

8 蒋杰;;深入浅出数据仓库平台统一架构[J];程序员;2010年11期

9 顾宏久;;浅谈虚拟化与云计算的关系[J];科学咨询(科技·管理);2011年08期

10 余晟;霍炬;;2000-2010十大最具技术影响力产品(国外)[J];程序员;2010年12期

相关会议论文 前10条

1 段德丰;钟慧娟;刘肖琳;;分布式计算在可视化仿真中的应用研究[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年

2 苏运霖;;网格计算在电网管理中的应用[A];第十一届全国电工数学学术年会论文集[C];2007年

3 马明全;周明全;耿国华;;分布式大规模交通网络实时模拟系统[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年

4 胡同森;陈庆章;;利用CORBA实现对各类关系数据库的访问[A];全国第十五届计算机科学与技术应用学术会议论文集[C];2003年

5 吴鹏;;计算机实时协同设计系统中同步过程的实现[A];浙江省电子学会2006年学术年会论文集[C];2006年

6 刘晓强;顾佳晨;张强;;钢铁企业MES平台软件研究[A];中国金属学会2003中国钢铁年会论文集(3)[C];2003年

7 陈晓铮;林新华;李明禄;伍民友;;基于SAGE的分布式虚拟现实框架[A];2008年全国开放式分布与并行计算机学术会议论文集(上册)[C];2008年

8 何峰;吴乐南;;分布式测试系统计算对象模型分析[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年

9 牧之内显文;有次正义;白光一;于戈;金子邦彦;;一个支持”数据集约性”应用的并行持久性语言的设计与实现[A];数据库研究与进展95——第十三届全国数据库学术会议论文集[C];1995年

10 李雪苹;杨宗煦;;一种基于组件的DSS模型管理方法的设计与实现[A];2003中国控制与决策学术年会论文集[C];2003年

相关重要报纸文章 前10条

1 于尚民;IONA SOA:全面改善IT系统[N];通信产业报;2007年

2 何进伟;迈向分布式计算的C++[N];中国计算机报;2002年

3 蒙克;“云”中漫步—解密云计算[N];网络世界;2008年

4 ;IT部门死亡之说夸大其词?[N];网络世界;2008年

5 ;虚拟化主题变奏曲[N];网络世界;2007年

6 杨霞清;张亚勤:云计算,微软并没有迟到[N];计算机世界;2008年

7 张旭军;立体云[N];网络世界;2010年

8 伟文;帮助企业实现随需应变[N];中国计算机报;2003年

9 雷阳;倾力高端企业市场 微软发布WCCS 2003[N];电脑商报;2006年

10 ;IONA基于Artix的电信解决方案[N];计算机世界;2006年

相关博士学位论文 前10条

1 姚鹤岭;基于REST的GIS Web服务研究[D];中国人民解放军信息工程大学;2005年

2 骆正虎;移动Agent系统若干关键技术问题研究[D];合肥工业大学;2002年

3 程欣;面向环和结的分布式死锁检测算法研究[D];哈尔滨工业大学;2006年

4 谢鲲;布鲁姆过滤器查询算法及其应用研究[D];湖南大学;2007年

5 齐德昱;可扩展的独立分布式应用互操作与集成模型[D];华南理工大学;1999年

6 徐向华;可适应的实时协同编辑系统若干问题研究[D];浙江大学;2005年

7 李成安;分布式环境下聚类分析新方法的研究[D];浙江大学;2006年

8 杨晗;端口—连接型产品配置研究与实现[D];浙江大学;2004年

9 宋勇;基于回路信息表达的新型联想记忆模型与算法研究[D];中国科学技术大学;2006年

10 任建武;GRID GIS关键技术研究[D];南京师范大学;2003年

相关硕士学位论文 前10条

1 向晓明;基于分布式蚁群算法的TSP问题研究[D];西南交通大学;2009年

2 王明宇;基于Mesh网络连通性问题求解的分布式计算平台的设计与实现[D];中南大学;2004年

3 王坤;基于分布式计算技术的RP通用软件系统的应用研究[D];南京航空航天大学;2002年

4 吴荣腾;基于DCOM的分布并行计算系统[D];福州大学;2004年

5 郭春燕;基于SOA的企业应用的研究与实现[D];大连理工大学;2006年

6 丁大虎;一个基于Web的分布式的共享数据库的工作流管理系统DFlow[D];天津大学;2005年

7 李明;基于CORBA的态势推演系统的设计与实现[D];国防科学技术大学;2007年

8 李书卉;分布式计算中的数据传输与管理的研究与实现[D];大连理工大学;2004年

9 王友良;基于CORBA中间件的负载平衡服务的研究[D];湖南大学;2005年

10 李冰;基于网闸的分布式工作流系统的设计和实现[D];华中科技大学;2008年



本文编号:1606028

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1606028.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3331d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com