基于双聚类方法的旅游数据挖掘与研究
发布时间:2021-04-27 15:15
双聚类算法(Biclustering Algorithm)于2000年被Cheng和Church提出后,在基因表达数据分析领域已有较为成熟的发展,但在其他领域的应用仍有待发掘,尤其在旅游大数据领域还未有应用。旅游大数据近年来作为热门话题,多被用于预测出行高峰期,旅游景点接客数量等。随着人们生活水平的提高,对旅游质量的要求越来越高,自由行、个性化旅游成为更多人的选择。因此对游客进行分类,针对不同类型的游客制定个性化旅游线路及服务,是非常有意义的课题。本论文将双聚类算法应用于旅游大数据研究,由此得到用户聚类结果,可以发掘潜在游客,也可针对不同用户制定个性化旅游路线,同时也能对旅游景点的热度进行预测。本论文采用python对旅游网站的用户数据进行采集,采集到的内容用Excel进行清洗,然后用ICTCLAS中文分词系统进行分词,并用TF-IDF算法提取高频关键词,同时对这些高频词进行词频统计。将出现频率较高的词作为变量,用户作为对象,建立用户-关键词矩阵。之后,再对建立的矩阵用双聚类算法进行聚类。通过对不同的聚类算法进行比较,找出了适合该高维旅游数据的算法。数据分析结果表明,双聚类算法对挖据到...
【文章来源】:云南大学云南省 211工程院校
【文章页数】:54 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.3 本文结构及创新点
第二章 聚类算法及大数据挖掘技术
2.1 聚类算法
2.2 双聚类算法
2.3 关键词提取
2.4 大数据挖掘技术
第三章 数据收集与处理
3.1 数据收集
3.2 数据处理
3.3 数据的矩阵表示
第四章 聚类与结果分析
4.1 gCLUTO聚类分析
4.2 双聚类结果分析
4.2.1 基于RB算法的聚类分析
4.2.2 基于Agglomerative算法的聚类分析
4.2.3 基于Graph算法的聚类分析
4.2.4 基于矩阵的聚类分析
第五章 总结与展望
5.1 总结
5.2 展望
附录
参考文献
致谢
【参考文献】:
期刊论文
[1]基于旅游者网络关注度的旅游景区日游客量预测研究——以不同客户端百度指数为例[J]. 孙烨,张宏磊,刘培学,张捷. 人文地理. 2017(03)
[2]基于双聚类的图书协同推荐方法[J]. 陈晓. 兰州交通大学学报. 2016(03)
[3]基于用户兴趣和兴趣点流行度的个性化旅游路线推荐[J]. 吴清霞,周娅,文缔尧,贺正红. 计算机应用. 2016(06)
[4]基于变异系数的双聚类算法及其在电信客户细分的应用研究[J]. 林勤,薛云,杨柏高. 计算机应用与软件. 2016(02)
[5]基于ILS-CS优化算法的个性化旅游线路研究[J]. 侯乐,杨辉华,樊永显,李灵巧,蒋淑洁. 计算机科学与探索. 2016(01)
[6]旅游大数据的MapReduce客户细分应用[J]. 汪永旗,王惠娇. 华侨大学学报(自然科学版). 2015(03)
[7]双聚类算法在电信高价值客户细分的应用[J]. 林勤,薛云. 计算机应用. 2014(06)
[8]基于特征词袋的双聚类算法研究[J]. 黄志艳. 计算机光盘软件与应用. 2014(02)
[9]中国旅游业的国际竞争力分析[J]. 魏娅楠. 经济研究导刊. 2012(31)
[10]特种旅游研究综述[J]. 李庆雷,康涛,荣俊杰. 重庆广播电视大学学报. 2012(01)
博士论文
[1]个性化旅游信息服务系统的基础理论与关键技术研究[D]. 赵晨阳.兰州大学 2012
硕士论文
[1]百度玩图的用户访问行为分析系统设计[D]. 李京.东北师范大学 2014
[2]基于基因表达数据的癌症分型方法[D]. 陈星.浙江大学 2007
[3]个性化旅游信息系统中用户建模技术的研究[D]. 王娟.北京邮电大学 2007
[4]假日旅游数据挖掘和流量模型的研究[D]. 白智广.北京工商大学 2006
本文编号:3163692
【文章来源】:云南大学云南省 211工程院校
【文章页数】:54 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.3 本文结构及创新点
第二章 聚类算法及大数据挖掘技术
2.1 聚类算法
2.2 双聚类算法
2.3 关键词提取
2.4 大数据挖掘技术
第三章 数据收集与处理
3.1 数据收集
3.2 数据处理
3.3 数据的矩阵表示
第四章 聚类与结果分析
4.1 gCLUTO聚类分析
4.2 双聚类结果分析
4.2.1 基于RB算法的聚类分析
4.2.2 基于Agglomerative算法的聚类分析
4.2.3 基于Graph算法的聚类分析
4.2.4 基于矩阵的聚类分析
第五章 总结与展望
5.1 总结
5.2 展望
附录
参考文献
致谢
【参考文献】:
期刊论文
[1]基于旅游者网络关注度的旅游景区日游客量预测研究——以不同客户端百度指数为例[J]. 孙烨,张宏磊,刘培学,张捷. 人文地理. 2017(03)
[2]基于双聚类的图书协同推荐方法[J]. 陈晓. 兰州交通大学学报. 2016(03)
[3]基于用户兴趣和兴趣点流行度的个性化旅游路线推荐[J]. 吴清霞,周娅,文缔尧,贺正红. 计算机应用. 2016(06)
[4]基于变异系数的双聚类算法及其在电信客户细分的应用研究[J]. 林勤,薛云,杨柏高. 计算机应用与软件. 2016(02)
[5]基于ILS-CS优化算法的个性化旅游线路研究[J]. 侯乐,杨辉华,樊永显,李灵巧,蒋淑洁. 计算机科学与探索. 2016(01)
[6]旅游大数据的MapReduce客户细分应用[J]. 汪永旗,王惠娇. 华侨大学学报(自然科学版). 2015(03)
[7]双聚类算法在电信高价值客户细分的应用[J]. 林勤,薛云. 计算机应用. 2014(06)
[8]基于特征词袋的双聚类算法研究[J]. 黄志艳. 计算机光盘软件与应用. 2014(02)
[9]中国旅游业的国际竞争力分析[J]. 魏娅楠. 经济研究导刊. 2012(31)
[10]特种旅游研究综述[J]. 李庆雷,康涛,荣俊杰. 重庆广播电视大学学报. 2012(01)
博士论文
[1]个性化旅游信息服务系统的基础理论与关键技术研究[D]. 赵晨阳.兰州大学 2012
硕士论文
[1]百度玩图的用户访问行为分析系统设计[D]. 李京.东北师范大学 2014
[2]基于基因表达数据的癌症分型方法[D]. 陈星.浙江大学 2007
[3]个性化旅游信息系统中用户建模技术的研究[D]. 王娟.北京邮电大学 2007
[4]假日旅游数据挖掘和流量模型的研究[D]. 白智广.北京工商大学 2006
本文编号:3163692
本文链接:https://www.wllwen.com/weiguanjingjilunwen/3163692.html