当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于游记的旅游信息垂直搜索引擎的设计与实现

发布时间:2017-08-29 13:32

  本文关键词:基于游记的旅游信息垂直搜索引擎的设计与实现


  更多相关文章: 垂直搜索引擎 旅游 Lucene 爬虫


【摘要】:现如今人民物质生活水平正在稳步提高,越来越多的人开始注重精神层面的提升,旅游已经成为人们日常休闲,放松心情的重要手段。出游前补足功课必不可少,从景点选择到路线规划,从美食特色到当地风俗,这些都是每一个游客关心的话题。在浩瀚的网络资源中挑选、制定出一个出游计划往往需要耗费游客大量的时间精力。游记作为人们游玩归来的总结,其中不仅记录着出行者当时的心情,更包含着重要的旅游信息,包括景点简介,个人感受,游玩路线,大致花销等等。为了减少游客出行前的准备时间,本文将设计并实现一个基于游记的垂直搜索引擎系统,为游客推荐出行路线和精彩游记。本论文的主要工作如下:1)研究了垂直搜索引擎的关键技术。首先简要介绍了当今旅游需求的背景及搜索引擎的发展状况,根据搜集方法和服务方式讲解了不同搜索引擎之间的差异。并对垂直搜索引擎的关键技术进行了研究,主要包括爬虫工作原理及主题爬虫算法,中文分词算法和倒排索引。然后较为详细的介绍了全文搜索引擎Lucene的使用方法,功能结构,索引和检索策略,评分机制。2)设计并实现了一款基于游记的旅游信息垂直搜索引擎系统。系统主要包含三个模块——信息采集模块,索引模块,用户查询模块。信息集模块,使用WebMagic爬虫框架,从web页面中提取信息,处理成结构化信息存储在本地;索引模块,使用全文检索工具包Lucene对采集到本地的结构化旅游信息进行索引;用户查询模块,检索功能使用Lucene检索策略,根据用户查询对文档打分并将结果返回给用户,页面展示功能使用SpringMVC框架对查询结果进行展示。本文从游客出行准备的实际情况出发,在调查了游客出行需求的基础上,设计并实现了一款基于游记的旅游信息垂直搜索引擎系统。
【关键词】:垂直搜索引擎 旅游 Lucene 爬虫
【学位授予单位】:重庆大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.3
【目录】:
  • 中文摘要3-4
  • 英文摘要4-8
  • 1 绪论8-12
  • 1.1 研究背景和意义8-9
  • 1.2 搜索引擎分类9-10
  • 1.3 垂直搜索引擎研究现状10-11
  • 1.4 本文组织结构11-12
  • 2 垂直搜索引擎关键技术12-26
  • 2.1 垂直搜索引擎工作原理12-13
  • 2.2 网络爬虫13-20
  • 2.2.1 网络爬虫工作流程13-14
  • 2.2.2 网络爬虫搜索策略14-16
  • 2.2.3 主题爬虫16-20
  • 2.3 信息检索20-25
  • 2.3.1 信息检索模型20-22
  • 2.3.2 中文分词22-23
  • 2.3.3 倒排索引23-25
  • 2.4 本章小结25-26
  • 3 Lucene相关技术研究26-34
  • 3.1 Lucene简介26-27
  • 3.2 Lucene组织结构27-29
  • 3.3 Lucene索引策略29-30
  • 3.3.1 索引结构29
  • 3.3.2 索引过程29-30
  • 3.4 Lucene搜索策略30-33
  • 3.4.1 搜索过程30-31
  • 3.4.2 Lucene评分机制31-33
  • 3.5 本章小结33-34
  • 4 旅游信息垂直搜索引擎的设计34-42
  • 4.1 系统目标和功能需求34-35
  • 4.1.1 系统目标34
  • 4.1.2 系统功能需求34-35
  • 4.2 系统架构设计35-41
  • 4.2.1 系统整体结构设计35-36
  • 4.2.2 信息采集模块设计36-38
  • 4.2.3 索引模块设计38-39
  • 4.2.4 用户查询模块设计39-41
  • 4.3 本章小结41-42
  • 5 旅游信息垂直搜索引擎的实现42-59
  • 5.1 系统开发环境42
  • 5.2 信息采集模块实现42-48
  • 5.3 索引模块实现48-52
  • 5.4 用户查询模块实现52-58
  • 5.5 本章小结58-59
  • 6 总结和展望59-61
  • 致谢61-62
  • 参考文献62-63

【相似文献】

中国期刊全文数据库 前10条

1 杨坚争;李朝平;;垂直搜索引擎及其应用[J];电子商务;2006年10期

2 罗丽姗;;垂直搜索引擎发展概述[J];图书馆学研究;2006年12期

3 严宏伟;何俊;;基于房源分析系统的垂直搜索引擎关键技术的探讨[J];中国科技信息;2007年05期

4 胡华梁;何进;钟元生;;图书垂直搜索引擎的设计[J];计算机与现代化;2007年08期

5 郑凯明;李义杰;;垂直搜索引擎及其应用价值[J];信息技术;2008年04期

6 毕建涛;霍云福;;垂直搜索引擎赢利模式探讨[J];大连大学学报;2008年03期

7 许鑫;黄仲清;;垂直搜索引擎应用中的若干策略探讨——以12580餐饮垂直搜索为例[J];现代图书情报技术;2009年02期

8 孔祥春;李义杰;郑凯明;;垂直搜索引擎应用研究[J];计算机系统应用;2009年07期

9 杨皖苏;闫冬;;垂直搜索引擎发展策略探讨[J];商业时代;2009年23期

10 肖婷;;垂直搜索引擎与旅游行业探讨[J];农业网络信息;2009年11期

中国重要会议论文全文数据库 前4条

1 褚蓓蓓;刘丹;;垂直搜索引擎:搜索引擎发展方向[A];2007年河北省电子学会、河北省计算机学会、河北省自动化学会、河北省人工智能学会、河北省计算机辅助设计研究会、河北省软件行业协会联合学术年会论文集[C];2007年

2 林欢欢;王文杰;史忠植;;移动环境下垂直搜索引擎[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

3 王上;于海;王钲旋;;Deep Web垂直搜索引擎设计与实现[A];第26届中国数据库学术会议论文集(B辑)[C];2009年

4 毛华扬;刘卫;;会计信息搜索方法研究[A];第十届全国会计信息化年会论文集[C];2011年

中国重要报纸全文数据库 前10条

1 北大纵横管理顾问公司高级顾问戴晓东;“商搜”变法 垂直搜索引擎的春天还远吗?[N];中国经营报;2006年

2 王艳;垂直搜索引擎市场看好[N];中国旅游报;2000年

3 王靖;赛迪网推出垂直搜索引擎[N];人民日报海外版;2000年

4 杨国民;国内生物医药行业 垂直搜索引擎诞生[N];经济日报;2007年

5 本报记者 王晓雁;垂直搜索引擎著作权之争未破题[N];法制日报;2009年

6 电子工业出版社 董娅 工业和信息化部电子科学技术情报研究所 周峻松;用开源软件建垂直搜索引擎[N];计算机世界;2010年

7 中新;生意宝推“生意搜”搅局电子商务搜索市场[N];经理日报;2008年

8 源讯 编译;搜索巨头的下一步[N];计算机世界;2006年

9 赛迪网 方刚;不只是网站才垂直[N];中国计算机报;2000年

10 ;沱沱网“亮剑”国际消费电子博览会 专业服务带来B2B差异化变革[N];中国贸易报;2007年

中国博士学位论文全文数据库 前5条

1 王晔;垂直搜索引擎若干问题研究[D];复旦大学;2011年

2 吴羽;面向时间敏感对象的垂直搜索引擎关键技术研究[D];浙江大学;2011年

3 胡宜敏;农业垂直搜索引擎语义化若干问题的研究与实现[D];中国科学技术大学;2012年

4 陈竹敏;面向垂直搜索引擎的主题爬行技术研究[D];山东大学;2008年

5 王桂红;农产品市场价格web信息分析方法研究[D];沈阳农业大学;2013年

中国硕士学位论文全文数据库 前10条

1 韩冰;垂直搜索引擎个性化推荐研究与应用[D];大连理工大学;2009年

2 关小敏;垂直搜索引擎的研究与实现[D];北京邮电大学;2012年

3 吴燕玮;基于行业知识垂直搜索引擎的研究与实现[D];北京邮电大学;2012年

4 柳力丽;旅游垂直搜索引擎的品牌传播研究[D];西南大学;2015年

5 钱永杰;面向网络文学的垂直搜索引擎的研究与实现[D];曲阜师范大学;2015年

6 袁凤云;垂直搜索引擎关键技术研究与实现[D];电子科技大学;2014年

7 任睿丽;面向旅游业的垂直搜索引擎的设计与实现[D];电子科技大学;2014年

8 张高伟;基于ElasticSearch的分布式视频垂直搜索引擎的设计与实现[D];哈尔滨工业大学;2014年

9 朱鹏;英文语料库垂直搜索引擎的研究与实现[D];北京邮电大学;2015年

10 杨小丹;面向教育资源c\索引擎的研究与实现[D];电子科技大学;2015年



本文编号:753556

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/753556.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户474ee***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com