当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于PubSubHubbub协议的Hub服务器的设计与实现

发布时间:2016-12-06 09:29

  本文关键词:LUCENE实现的基于RSS的博客搜索引擎,,由笔耕文化传播整理发布。


《华中科技大学》 2010年

基于PubSubHubbub协议的Hub服务器的设计与实现

章谨麟  

【摘要】:随着互联网技术的快速发展,互联网也已经成为人们生活,学习和工作中的重要组成部分。同时,信息爆炸也使我们陷入信息的海洋中。为了解决这些问题,搜索引擎技术应运而生,帮我们从海量信息中提取有效信息。同时随着人们对搜索的实时性要求越来越高,实时搜索成为了目前的重要方向。 rss和atom技术以及博客的兴起,也便利了人们的生活和工作,娱乐等。但是以往的对rss轮询的模式给服务器造成了很大的负担。新的发布/订阅协议PubSubHubbub协议应运而生。 PubSubHubbub协议是一种新的发布者/订阅者协议,目的是为了让订阅者能实时查看更新,以减轻服务器的负担。当订阅者订阅了这个rss或者atom的地址,不需要像以前一样去去轮询该地址,以发现该博客是否更新,是否发表了新的文章等信息,而是通过hub服务器将这个feed url的实时的更新信息发送给订阅者。 PubSubHubbub协议对于实时搜索也具有非常重要的意义。使用PubSubHubbub协议,搜索引擎可以及时的发现被更新了的和新出现的网页,以便于抓取和分析。 在PubSubHubbub协议中,hub服务器是最重要的部分,主要是接受订阅者订阅和取消订阅,并对订阅者进行认证,同时接受发布者发布的更新消息,并将这些消息进行转发。 为了使PubSubHubbub协议有助于实时搜索的实现,hub服务器同时接受网络蜘蛛的订阅和取消订阅,并将更新消息给搜索引擎,这样搜索引擎就可以及时的获得并处理这些更新信息,以增强实时性。

【关键词】:
【学位授予单位】:华中科技大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP368.5
【目录】:

下载全文 更多同类文献

CAJ全文下载

(如何获取全文? 欢迎:购买知网充值卡、在线充值、在线咨询)

CAJViewer阅读器支持CAJ、PDF文件格式


【参考文献】

中国期刊全文数据库 前7条

1 ;Twitter值得关注的实时搜索引擎五大趋势[J];中国传媒科技;2009年06期

2 吴敏琦;丁岳伟;;基于Nutch的XML网站全文搜索引擎实现[J];计算机工程;2008年15期

3 封硕;赵捧未;施水才;;基于RSS的分布式博客搜索引擎的研究[J];情报杂志;2007年08期

4 林芗;略谈信息爆炸与信息稀缺[J];图书馆论坛;1999年01期

5 张锦炘;;基于Nutch的中文搜索引擎的构建[J];图书馆研究与工作;2009年01期

6 王娜;;博客搜索引擎与传统搜索引擎的比较研究[J];图书情报工作;2006年07期

7 崔滨;万旺根;余小清;楼顺天;;基于EPOLL机制的LINUX网络游戏服务器实现方法[J];微计算机信息;2006年21期

中国硕士学位论文全文数据库 前3条

1 黎斌;可扩展分布式垂直搜索引擎设计与实现研究[D];国防科学技术大学;2008年

2 尹辉;基于Nutch的搜索系统的研究[D];电子科技大学;2008年

3 刘双林;LUCENE实现的基于RSS的博客搜索引擎[D];哈尔滨工程大学;2009年

【共引文献】

中国期刊全文数据库 前10条

1 黄力,杨志良;现代天文教育和研究平台——虚拟天文台[J];北京师范大学学报(自然科学版);2005年03期

2 王美霞;;智能语义搜索引擎的探究[J];电脑知识与技术;2009年12期

3 王奕钧;胡亮;李宏图;林宇;;可定时更换密钥的IBE体系[J];电信科学;2008年12期

4 苗勃;吴力夫;王羽;施娟;;网络棋牌游戏平台通用架构与关键技术[J];广播电视信息;2010年03期

5 夏天;;Nutch的插件机制分析[J];广西师范大学学报(自然科学版);2010年01期

6 张程;陈自郁;古平;杨瑞龙;;基于DOM树结构的Blog网页自动识别[J];计算机应用研究;2008年05期

7 黄默丽;王丽婷;;博客与电子预印本的比较分析[J];江西图书馆学刊;2009年01期

8 廖大容;;浅析网络信息检索的方法——搜索引擎[J];内蒙古科技与经济;2009年18期

9 方宏;吕太之;;动态网页信息提取技术在求职搜索中的应用[J];计算机工程;2009年24期

10 刘威;陈小惠;谢鹏;李劼;袁巍;;高速RFID编码解析服务器软件的设计与实现[J];计算机应用与软件;2011年01期

中国硕士学位论文全文数据库 前10条

1 窦文礼;电力调度系统录音服务器的设计与实现[D];东北大学;2008年

2 付红艳;Web多文档自动文摘研究[D];哈尔滨工程大学;2010年

3 邱尚明;面向专利的主题搜索引擎技术研究与实现[D];华南理工大学;2009年

4 李劼;高性能RFID编码解析系统的设计与实现[D];华中科技大学;2009年

5 李建林;基于Lucene的Web搜索引擎的研究[D];兰州理工大学;2010年

6 章华;安全网络棋牌游戏平台的架构研究和设计[D];电子科技大学;2009年

7 寇功杰;我国博客及其传播效果研究[D];华东师范大学;2009年

8 曾小能;XML安全技术在网络申报系统中的研究与应用[D];中南大学;2009年

9 王辉;基于IMS的媒体转发功能的研究与实现[D];华中科技大学;2008年

10 石占伟;垃圾页面检测及其在垂直搜索引擎中的应用[D];燕山大学;2010年

【二级参考文献】

中国期刊全文数据库 前10条

1 陈曙;信息生态研究[J];图书与情报;1996年02期

2 苏云;搜索引擎Google检索技巧研究[J];甘肃科技;2005年02期

3 赵鑫,武刚;搜索引擎的发展与展望[J];河北林果研究;2004年01期

4 刘挺,吴岩,王开铸;最大概率分词问题及其解法[J];哈尔滨工业大学学报;1998年06期

5 王浩;;新一代博客搜索引擎的开发[J];黑龙江科技信息;2008年11期

6 刘群,张华平,俞鸿魁,程学旗;基于层叠隐马模型的汉语词法分析[J];计算机研究与发展;2004年08期

7 李凯,赫枫龄,左万利;PageRank-Pro——一种改进的网页排序算法[J];吉林大学学报(理学版);2003年02期

8 朱炜;王超;李俊;潘金贵;;Web超链分析算法研究[J];计算机科学;2003年09期

9 金瑜,陆启明,高峰;基于上下文相关的最大概率汉语自动分词算法[J];计算机工程;2004年16期

10 印鉴,陈忆群,张钢;搜索引擎技术研究与发展[J];计算机工程;2005年14期

中国硕士学位论文全文数据库 前4条

1 张校乾;基于Lucene的全文检索系统的研究与应用[D];大连理工大学;2005年

2 刘平冰;基于Lucene的Web站内信息搜索系统[D];电子科技大学;2005年

3 李盛韬;基于主题的Web信息采集技术研究[D];中国科学院研究生院(计算技术研究所);2002年

4 许林杰;中文文本分词研究[D];山东师范大学;2003年

【相似文献】

中国期刊全文数据库 前10条

1 刘桂玲;;FTP传输新闻图文的应用[J];中国有线电视;2009年04期

2 朱才玺;;三种线程池比较[J];科技风;2009年06期

3 肖长健;;利用VB6.0的Winsock控件创建TCP/IP通讯程序[J];才智;2008年16期

4 郭占山;杜鑫;;VB开发GPIB接口仪器网络测试研究[J];中国计量;2008年09期

5 刘硕;;特洛伊木马浅析[J];中国科技信息;2007年02期

6 徐小红;;Agent技术及其应用[J];电脑知识与技术(学术交流);2007年01期

7 邵泳兵;;基于Delphi的三层数据库系统的实现方法[J];广西轻工业;2007年01期

8 魏骏;张世峰;蒋一;;MATLAB与WinCC的动态数据交换技术[J];工业控制计算机;2007年01期

9 王晓楠;;基于Anycast服务的防火墙与入侵检测系统联动的研究与实现[J];常熟理工学院学报;2007年02期

10 王静;曲凤娟;;基于Socket的多用户并发通信的设计[J];福建电脑;2007年03期

中国重要会议论文全文数据库 前10条

1 张继周;;高性能I/O完成端口服务器的应用研究[A];第十二届中国青年信息与管理学者大会论文集[C];2010年

2 蒋敬旗;;客户/服务器模式下网络聊天系统的设计与实现[A];2010国际信息技术与应用论坛论文集[C];2010年

3 靳昂;江建慧;楼俊钢;;基于加速寿命试验的Web服务器测评[A];第六届中国测试学术会议论文集[C];2010年

4 龚雪;;基于VB技术开发C/S通信软件[A];OA’2010办公自动化国际学术研讨会论文集[C];2010年

5 刘伟虹;王秀;;生产管理信息平台系统的开发与应用[A];2010全国能源与热工学术年会论文集[C];2010年

6 李大红;;浅析内网FTP服务器的架设[A];2010全国机械装备先进制造技术(广州)高峰论坛论文汇编[C];2010年

7 鲁玲;;MCGS与MATLAB的DDE通讯设计[A];2009系统仿真技术及其应用学术会议论文集[C];2009年

8 谢梦洲;周小青;袁肇凯;瞿岳云;胡志希;顾星;王玉;瞿年清;;《中医诊断学》计算机网络考试、训练系统[A];中国中西医结合学会诊断专业委员会2009’年会论文集[C];2009年

9 常战芳;安丰涛;刘利智;刘朝琴;张海华;;信息化技术在钢铁行业安全源点管理中应用[A];2009年河北省轧钢技术与学术年会论文集(上)[C];2009年

10 张蒙;;GPRS测试中的非网络质量问题分析[A];中国通信学会第五届学术年会论文集[C];2008年

中国重要报纸全文数据库 前10条

1 记者 童海华;[N];中国经济导报;2008年

2 周婷;[N];中国证券报;2008年

3 本报记者 蒋秀娟 实习生 贾海;[N];科技日报;2007年

4 张丹丽;[N];中国新闻出版报;2007年

5 于瀛 包力 黄炎 实习生 丘惠莲 通讯员 徐强 陶瑜;[N];深圳商报;2006年

6 本报记者撰述;[N];亚太经济时报;2006年

7 湖南 头重脚轻;[N];电脑报;2005年

8 顾洪洪;[N];工人日报;2005年

9 本报记者 顾洪洪;[N];经济参考报;2005年

10 angeljuliet;[N];电脑报;2004年

中国博士学位论文全文数据库 前1条

1 陈荣华;实时流媒体内容分发系统优化研究[D];复旦大学;2010年

中国硕士学位论文全文数据库 前10条

1 马钺;基于μC/OS-Ⅱ的远程控制系统[D];华东理工大学;2011年

2 王秋实;嵌入式瘦Web服务器研究[D];沈阳航空工业学院;2010年

3 张明;新型DCS组态软件OPC客户端和服务器的研究与开发[D];山东大学;2010年

4 牛继宾;基于网络加速的P2P文件共享系统的研究与设计[D];华北电力大学(北京);2010年

5 杨森香;网络安全监管系统的研究与应用[D];华北电力大学(北京);2010年

6 阎志峰;基于NET技术的OPC UA服务器地址空间的研究与设计[D];华北电力大学(北京);2010年

7 殷垚;基于Web技术的OPC XML数据访问服务器的研究与开发[D];华北电力大学(北京);2010年

8 邢长贺;基于VC程序控制的VHF通信系统[D];大连海事大学;2010年

9 周勇;海底观测网数据库服务器的设计与实现[D];湖南师范大学;2010年

10 张帆;网络对战游戏服务器的分析与设计[D];吉林大学;2010年


  本文关键词:LUCENE实现的基于RSS的博客搜索引擎,由笔耕文化传播整理发布。



本文编号:206144

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/206144.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户bf2dd***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com