当前位置:主页 > 科技论文 > 搜索引擎论文 >

面向旅游业的垂直搜索引擎的设计与实现

发布时间:2020-11-14 15:26
   伴随着国民生活水平的提高,旅游日趋成为消费者休闲的重要方式之一。在出游前,选择旅游景区,规划最有旅游计划成为困扰人们的难题。伴随着互联网技术的发展,人们出行前往往喜欢通过Internet搜索旅游相关信息,然而传统搜索引擎面对特定领域的搜索任务,往往返回数以万计的搜索结果,其中包含大量领域无关页面。在此背景下,本文研究面向旅游业的垂直搜索引擎,垂直搜索引擎是相对通用搜索引擎的信息量大、查询不准确、深度不够等提出来的新的搜索引擎模式,其特点就是“专、精、深”,且具有行业色彩。显然,面向旅游业的垂直搜索引擎能够向外出旅行的人提供更加专著、精确和有深度的信息。本文的主要工作包括以下几个方面。首先调研旅游业的信息需求和业务需求。信息需求分析是搜集游客关心的信息类型,例如景区信息、交通、住宿、当地风俗等等,信息需求定义了垂直搜索引擎的信息集成边界,是进行页面过滤的基础。业务需求分析主要是调研垂直搜索引擎向用户提供信息的业务流程,是进行功能设计的基础。其次,在需求分析的基础上,进行面向旅游业的垂直搜索引擎的整体性设计。垂直搜索引擎是一项内部逻辑结构复杂的系统,其包括分工明确的前台和后台,前台主要有向用户提供信息查询的API构成,后台主要负责页面的信息集成,包括爬虫、网页过滤、主题词库、网页存储、索引等众多功能模块,前后台并行运作,为游客提供信息支持。第三,在整体设计的基础上着重介绍了垂直搜索引擎三大核心功能模块的设计和实现,包括:页面过滤、爬虫和检索。本文基于广度优先的爬虫策略进行页面的全信息解析和保存,包括文字、图片、影音等;在主题词库的基础上设计了基于朴素贝叶斯分类器的页面过滤方法;在基于Lucene全文检索的基础上,设计了基于页面元数据检索功能,提供更加全面的信息查询功能。最后,在J2EE环境下进行系统的模型的开发和测试。
【学位单位】:电子科技大学
【学位级别】:硕士
【学位年份】:2014
【中图分类】:TP391.3
【文章目录】:
摘要
ABSTRACT
第一章 绪论
    1.1 课题的研究背景
        1.1.1 旅游业的发展现状
        1.1.2 信息时代智慧旅游的发展
        1.1.3 垂直搜索引擎的应用
    1.2 研究意义
    1.3 研究目的及主要工作
        1.3.1 研究目的
        1.3.2 主要工作
    1.4 本论文的章节安排
第二章 相关理论基础和技术路线
    2.1 垂直搜索引擎
        2.1.1 搜索引擎
        2.1.2 垂直搜索引擎
        2.1.3 垂直搜索引擎的研究现状
    2.2 爬虫相关理论
        2.2.1 概述
        2.2.2 评价标准
        2.2.3 国内外相关研究现状
    2.3 信息检索相关理论
        2.3.1 概述
        2.3.2 国内外研究现状
    2.4 垂直搜索引擎的发展前景
    2.5 垂直搜索引擎与J2EE
        2.5.1 J2EE
        2.5.2 Lucene
    2.6 本章小结
第三章 需求分析和系统设计
    3.1 引言
    3.2 面向旅游业的垂直搜索引擎的需求分析
        3.2.1 概述
        3.2.2 数据需求分析
        3.2.3 功能性需求分析
        3.2.4 非功能性需求分析
    3.3 垂直搜索引擎的整体性设计
        3.3.1 功能架构设计
        3.3.2 内部逻辑架构设计
        3.3.3 物理架构设计
    3.4 数据存取设计方案
        3.4.1 网页数据
        3.4.2 索引数据
    3.5 本章小结
第四章 垂直搜索引擎主要功能的实现
    4.1 Spider
        4.1.1 面向主题的Spider工作原理
        4.1.2 详细设计
        4.1.3 基于Httpclient的Spider的实现
    4.2 网页过滤
        4.2.1 主题词库
        4.2.2 基于朴素贝叶斯分类器的网页分类
    4.3 网页元数据抽取
        4.3.1 Web信息抽取
        4.3.2 基于HTML的网页元数据抽取
    4.4 基于Lucene的全文检索
        4.4.1 全文索引
        4.4.2 基于Lucene的全文索引的实现
    4.5 本章小结
第五章 系统实施与测试
    5.1 开发环境
    5.2 运行环境
    5.3 系统测试
        5.3.1 测试内容与方法
        5.3.2 结果分析
    5.4 应用实例展示
    5.5 本章小结
第六章 结束语
致谢
参考文献

【相似文献】

相关期刊论文 前10条

1 郑凯明;李义杰;;垂直搜索引擎及其应用价值[J];信息技术;2008年04期

2 许鑫;黄仲清;;垂直搜索引擎应用中的若干策略探讨——以12580餐饮垂直搜索为例[J];现代图书情报技术;2009年02期

3 肖婷;;垂直搜索引擎与旅游行业探讨[J];农业网络信息;2009年11期

4 祝奕;;垂直搜索引擎的构建与应用[J];信息与电脑(理论版);2010年01期

5 张美芳;张迎春;;浅议垂直搜索引擎服务市场的商业模式[J];现代商业;2010年06期

6 焦龙;;垂直搜索引擎在旅游企业中应用的探索[J];商场现代化;2010年08期

7 赵宏中;李亚;;垂直搜索引擎应用研究[J];现代商贸工业;2010年04期

8 陈高维;邓天权;曾云磊;王维国;张龙;;基于垂直搜索引擎的旅游线路评价模型的设计[J];科技创新导报;2010年18期

9 刘小强;;二手转让及房产租售垂直搜索引擎的设计与实现[J];三门峡职业技术学院学报;2010年03期

10 郑凯明;;垂直搜索引擎应用研究[J];赤峰学院学报(自然科学版);2011年02期


相关博士学位论文 前5条

1 王晔;垂直搜索引擎若干问题研究[D];复旦大学;2011年

2 吴羽;面向时间敏感对象的垂直搜索引擎关键技术研究[D];浙江大学;2011年

3 胡宜敏;农业垂直搜索引擎语义化若干问题的研究与实现[D];中国科学技术大学;2012年

4 陈竹敏;面向垂直搜索引擎的主题爬行技术研究[D];山东大学;2008年

5 王桂红;农产品市场价格web信息分析方法研究[D];沈阳农业大学;2013年


相关硕士学位论文 前10条

1 海涛;垂直搜索引擎数据采集技术的研究与实现[D];华北电力大学(北京);2008年

2 崔诗远;基于垂直搜索引擎的旅行社网络营销[D];青岛大学;2009年

3 翟晓玲;面向学科的基础教育资源垂直搜索引擎的研究与实现[D];东北师范大学;2009年

4 王嘉杰;面向博客领域的垂直搜索引擎的研究与实现[D];北京邮电大学;2009年

5 刘明君;垂直搜索引擎传播学特征及应用研究[D];华中科技大学;2008年

6 黎斌;可扩展分布式垂直搜索引擎设计与实现研究[D];国防科学技术大学;2008年

7 李春燕;企业信息垂直搜索引擎的研究与实现[D];中国地质大学(北京);2010年

8 石占伟;垃圾页面检测及其在垂直搜索引擎中的应用[D];燕山大学;2010年

9 张楠;面向汽车主题的垂直搜索引擎研究与实现[D];西南交通大学;2010年

10 陈向东;宠物用品垂直搜索引擎研究与设计[D];西北农林科技大学;2010年



本文编号:2883631

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2883631.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ca63a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com