基于云计算的旅游服务推荐算法的设计与应用
发布时间:2017-09-02 17:09
本文关键词:基于云计算的旅游服务推荐算法的设计与应用
更多相关文章: 智慧旅游 云计算 Hadoop FP-Growth 旅游服务推荐
【摘要】:“智慧旅游”是当前中国旅游业信息化建设的主要任务和热点研究问题,其“智慧”体现在“旅游服务的智慧”、“旅游管理的智慧”和“旅游营销的智慧”三大方面。旅游服务推荐是当今旅游行业比较推崇的营销策略,一直被广泛的研究,在某种程度上它是智慧的体现。如今旅游数据正变得日趋庞大,存储和处理这些数据变成了一个难题。同时,对于信息的检索,搜索引擎并不能满足用户多元化和个性化的需求,也不能有效的解决信息负载的问题。推荐引擎作为解决信息负载的另一个方法,不但可以通过推荐技术为用户找到了合适的或潜在需要的信息,而且能为用户带去更好的体验。但是面对大数据的挑战,需要有新的平台和合适有效的算法来应对。 Hadoop作为优秀的云计算平台,是目前研究大数据问题最好的工具之一,其MapReduce可以利用分布式计算对海量数据做快速的处理,而且它的HDFS在存储方面安全、稳定,有很高的容错性。通过在Hadoop平台编写算法,解决从海量旅游数据中获取有效信息是本文的一个尝试,本文将通过对经典的数据挖掘算法FP-Growth实现并行化,并应用在旅游服务推荐方面,进一步实现云环境下的旅游服务推荐系统。 通过对推荐算法和系统框架进行仔细的研究,本文将重点完成四大模块:第一,对海量旅游数据进行采集,为所有实验做好数据准备;第二,对旅游数据进行分析,本文将从旅游时空分布格局统计分析和基于社会网旅游流的核心景区分析两方面进行研究;第三,云平台下的旅游服务推荐算法的设计,通过认真深入研究Hadoop平台,学习MapReduce的运行机制和编程方法,对经典的FP-Growth算法实现并行化,最终完成推荐系统的核心算法部分;第四,完成整个推荐系统构架,实现对旅游六大要素的若干服务组合的推荐。 在大数据背景下,研究旅游信息服务,这既是对云环境下的算法研究,同时又是对实际应用的研究。本文对基于Hadoop云平台的旅游推荐系统的研究,在理论上,研究了云平台下旅游数据挖掘的算法模型。在实践上,对探索海量数据下旅游服务推荐系统的设计与实现进行了实验。
【关键词】:智慧旅游 云计算 Hadoop FP-Growth 旅游服务推荐
【学位授予单位】:陕西师范大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP391.3;F592
【目录】:
- 摘要3-4
- Abstract4-8
- 第1章 绪论8-16
- 1.1 研究背景8-9
- 1.1.1 云计算8
- 1.1.2 推荐系统8-9
- 1.1.3 大数据9
- 1.2 研究意义9-10
- 1.3 国内外研究现状10-13
- 1.3.1 国内外旅游信息服务的研究现状10
- 1.3.2 推荐系统的研究现状10-13
- 1.4 课题研究的主要内容13-14
- 1.5 论文组织结构14-16
- 第2章 实现旅游服务推荐的基础理论16-24
- 2.1 个性化推荐系统16-21
- 2.1.1 个性化推荐技术对比16-18
- 2.1.2 个性化推荐系统的组成18-20
- 2.1.3 个性化旅游服务推荐的作用20-21
- 2.2 社会网络分析理论21-22
- 2.2.1 社会网络分析法21
- 2.2.2 城市旅游流网络构建21-22
- 2.3 本章小结22-24
- 第3章 云计算平台HADOOP24-34
- 3.1 分布式文件系统HDFS24-26
- 3.2 HADOOP计算模型——MAPREDUCE26-29
- 3.2.1 MapReduce编程模型27
- 3.2.2 MapReduce编程实现27-28
- 3.2.3 MapReduce运行过程28-29
- 3.3 关系数据ETL工具SQOOP29-32
- 3.3.1 Sqoop使用方法实例29-32
- 3.4 本章小结32-34
- 第4章 云计算环境下旅游服务推荐系统框架设计34-44
- 4.1 数据采集模块分析34-35
- 4.1.1 数据采集工具34-35
- 4.1.2 本站数据获取35
- 4.2 数据分析模块35-37
- 4.2.1 旅游季节性统计分析35-36
- 4.2.2 基于社会网的旅游流的分析36-37
- 4.3 推荐算法并行化模块分析37-41
- 4.3.1 关联规则算法分析37-40
- 4.3.2 FP-Growth算法并行化40-41
- 4.4 服务推荐模块41-43
- 4.4.1 推荐服务建模41-42
- 4.4.2 服务推荐流程42-43
- 4.5 本章总结43-44
- 第5章 旅游信息服务推荐系统实现44-62
- 5.1 数据的采集44-46
- 5.1.1 从旅游社区网站上采集数据44-45
- 5.1.2 采集数据的整理45-46
- 5.2 旅游数据的分析46-51
- 5.2.1 旅游时空分布格局统计分析46-48
- 5.2.2 基于社会网旅游流的核心景区分析48-51
- 5.3 分布式HADOOP平台的搭建51-56
- 5.3.1 搭建环境准备51-52
- 5.3.2 安装并配置jdk52
- 5.3.3 安装ssh52-53
- 5.3.4 安装hadoop53-56
- 5.4 MAPREDUCE FP-GROWNTH算法并行化实验56-62
- 5.4.1 实验数据56-57
- 5.4.2 实验结果57-62
- 第6章 总结与展望62-64
- 6.1 总结62
- 6.2 展望62-64
- 参考文献64-66
- 致谢66
【参考文献】
中国期刊全文数据库 前2条
1 平亮;宗利永;;基于社会网络中心性分析的微博信息传播研究——以Sina微博为例[J];图书情报知识;2010年06期
2 陶雪娇;胡晓峰;刘洋;;大数据研究综述[J];系统仿真学报;2013年S1期
,本文编号:779795
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/779795.html