当前位置:主页 > 科技论文 > 软件论文 >

基于空间数据挖掘的热门景点及线路推荐研究

发布时间:2018-03-04 23:16

  本文选题:空间数据挖掘 切入点:地理标签照片 出处:《华中师范大学》2017年硕士论文 论文类型:学位论文


【摘要】:随着科技的发展和人们生活水平的提高,旅行已经成为越来越多的人生活中至关重要的一环,虽然现在有关旅行的应用系统很多,但真正能够满足用户实际需求的却很少,例如通过搜索引擎或者旅行网站搜索的结果往往是旅行公司的商业推广或者旅游景点的过度宣传。如何让游客在一个陌生的城市中快捷方便地找到热门旅游景点并规划好游玩路线,这是智慧旅游时代自助旅游者的迫切需求。本文总结了国内外关于空间数据挖掘和旅游推荐的相关技术和方法,并在此基础上提出了一种基于空间数据挖掘的热门景点和线路推荐方法。由于大部分旅行者都有拍照的习惯并且喜欢在社交媒体上分享这些照片,本文首先从大型图片分享网站Flickr上挖掘了大量带有空间地理信息和文本Tag的Geo图片,通过 P-DBSCAN(A Parallel of Density-Based Spatial Clustering of Applications with Noise, 一种并行的基于密度的聚类算法)聚类算法对这些用户上传的携带空间地理信息的图片进行空间聚类得到图片所在的景点集,然后根据文本Tag将这些聚类得到的景点与真实的景点进行对应,并构建景点数据库。然后,计算游客对不同景点的游览次数来找出热门景点,根据游客的旅行历史和背景信息等利用协同过滤算法计算用户相似度,并以此为依据进行个性化景点推荐,在推荐的同时考虑天气和时间等因素。最后,对游客的旅行历史进行分析可以提取出游客的旅行轨迹,使用序列模式挖掘算法分析出热门旅行路线,再根据游客的旅行历史和当前的搜索文本来进行个性化的线路推荐。本文在聚类的过程中采用了 P-DBSCAN算法,通过实验证明P-DBSCAN算法在密度分布不均的情况下聚类效果明显优于DBSCAN算法。而在推荐过程中引用了 Apache Mahout提供的一个协同过滤算法的推荐引擎Taste,并在Android设备上展示最终推荐结果。
[Abstract]:With the development of science and technology and the improvement of people's living standard, travel has become a vital part of life more and more people, although the application system about traveling a lot, but be able to meet the actual needs of users rarely, for example through search engines or travel site search is often the result of excessive promotional or commercial Travel Company tourist attractions. How to let visitors in a strange city in fast and convenient to find popular tourist attractions and planning to visit route, this is the urgent demand of wisdom tourism era self-help tourists. This paper summarizes the related technologies of spatial data mining and tourism recommendation and methods at home and abroad, and put forward a based on spatial data mining for hot spots and lines. The recommended method of most of the travelers have the habit of taking pictures and in love Social media to share these photos, this paper from the large photo sharing website Flickr mining with a lot of spatial geographic information and text Tag Geo images, through P-DBSCAN (A Parallel of Density-Based Spatial Clustering of Applications with Noise, a parallel clustering algorithm based on density clustering algorithm) for these users to upload carry geographical space the picture information spatial clustering images obtained by the attractions set, and then the clustering obtained spots corresponding to the real attractions according to the text Tag, and construct the scene points according to the library. Then, the calculation of the number of tourists to visit different scenic spots to find hot spots, calculated according to the similarity of users travel history and background information by tourists the collaborative filtering algorithm, and as a basis for personalized recommendation, and consider the weather in the recommended at the same time Among other factors. Finally, analysis can extract the travel trajectory of tourists on the tourist travel history, mining algorithm analysis hot travel route using the sequence pattern, according to the tourists travel history and the current search text to personalize the lines recommended. This paper uses the P-DBSCAN algorithm in the clustering process, proved by experiments P-DBSCAN clustering algorithm in the case of uneven density distribution is better than the DBSCAN algorithm. In the process of recommendation refers to a collaborative filtering recommendation engine Taste Apache provided by Mahout, and show the final recommendation on the Android devices.

【学位授予单位】:华中师范大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP311.13;TP391.3

【参考文献】

相关期刊论文 前10条

1 林娜;郑亚男;;基于出租车轨迹数据的路径规划方法[J];计算机应用与软件;2016年01期

2 陈娟;钟雨露;邓胜利;;移动社交平台用户体验的影响因素分析与实证——以微信为例[J];情报理论与实践;2016年01期

3 李鹏;程明;;移动互联网技术的应用[J];黑龙江科学;2014年09期

4 袁怀旺;李积丰;徐彪;霍欢;;融合位置和社交属性的热点轨迹聚类算法[J];计算机工程与应用;2015年07期

5 杨长春;周猛;叶施仁;徐小松;;基于改进CURE算法的微博热点话题发现[J];计算机仿真;2013年11期

6 宋秋银;;基于云计算的数据挖掘技术研究[J];电脑编程技巧与维护;2013年08期

7 王树良;丁刚毅;钟鸣;;大数据下的空间数据挖掘思考[J];中国电子科学研究院学报;2013年01期

8 党辉;王治和;潘丽娜;;基于云模型的模糊数据挖掘研究与应用[J];电脑知识与技术;2013年04期

9 苟光磊;崔贯勋;王柯柯;;基于属性重要性的Cobweb算法[J];重庆理工大学学报(自然科学);2012年12期

10 王颖;金志军;;常用数字滤波算法[J];中国计量;2012年03期

相关会议论文 前1条

1 宫蕊;舒红平;郭远远;;基于DBSCAN的密度聚类算法的研究[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年

相关博士学位论文 前1条

1 Abdul Majid;基于地理标签的社会媒体数据挖掘的智能旅游推荐研究[D];浙江大学;2012年

相关硕士学位论文 前6条

1 胡乔楠;基于旅游文记的旅游景点推荐及行程路线规划系统[D];浙江大学;2015年

2 宋春晓;空间数据挖掘在基于GIS的智能交通系统中的应用[D];西安电子科技大学;2013年

3 赵卓真;一种基于密度与网格的聚类方法[D];中山大学;2012年

4 葛登科;基于GIS的空间数据挖掘方法研究[D];西安电子科技大学;2010年

5 杨坤;基于空间数据挖掘的超市选址决策研究[D];青岛大学;2008年

6 胡斌;基于网格技术的分布式空间数据挖掘算法研究[D];中南大学;2008年



本文编号:1567739

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1567739.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9b6a9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com