序列模式挖掘算法在超市O2O营销中的应用及优化研究
发布时间:2023-04-04 21:21
随着互联网技术的发展,互联网信息呈爆炸式的增长,超市作为典型的传统零售企业,其发展从开始的人工数据管理模式,已逐渐演变为利用现代信息技术进行O2O营销管理。而如何运用现有的技术和手段,对超市内部的海量数据进行深度分析,挖掘出有价值的信息和规律,并以此作出正确及时的决策,现已成为超市生存和发展的重要环节。数据挖掘技术中,序列模式挖掘的目标是从交易数据库中发现客户购买行为的序列模式,因此成为了超市O2O营销的重要抓手。利用序列模式挖掘技术对大量的交易数据进行研究和挖掘,可以加速线上与线下资源整合,使商家能以更低的成本高效率地服务客户、赢得客户,另外,将挖掘出的知识应用于超市日常的经营和管理,可以促进超市的发展。本文首先利用Python语言对超市O2O营销产生的数据集进行了初步的统计分析,通过年龄、性别、等级、注册时间等七个维度的分析,了解了超市数据的分布情况,其中,会员表所包含的用户中,大部分为年轻用户,结合用户等级与他们的注册时长可以得出,大体上用户注册时间越长,等级就越高;之后基于Hadoop平台,结合AprioriSome算法的思想,在Hive中利用HiveQL语句对超市的交易数据集...
【文章页数】:66 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 课题研究背景及意义
1.2 国内外研究现状
1.2.1 O2O模式发展现状
1.2.2 序列模式挖掘发展现状
1.3 论文的研究内容及创新点
1.4 论文的组织结构
2 课题理论基础及相关技术
2.1 序列模式挖掘
2.1.1 序列模式挖掘简介
2.1.2 序列模式挖掘算法分类
2.1.3 相关定义
2.1.4 主要性质
2.1.5 AprioriSome算法
2.2 Hadoop大数据平台
2.2.1 Hadoop平台简介
2.2.2 HDFS分布式文件系统
2.2.3 MapReduce分布式计算框架
2.2.4 Yarn通用资源管理器
2.2.5 Hive工具简介
2.3 本章小结
3 数据预处理及初步统计分析
3.1 数据来源及特点分析
3.2 数据预处理
3.3 超市数据的统计分析
3.3.1 用户基本信息统计分析
3.3.2 销售数据统计分析
3.4 本章小结
4 基于Hadoop的序列模式挖掘算法的实现
4.1 数据来源及数据清洗
4.2 Hadoop集群环境的搭建
4.2.1 硬件环境
4.2.2 软件环境
4.3 实验过程
4.4 实验结果分析
4.5 在超市O2O营销领域的应用
4.6 本章小结
5 序列模式挖掘中AprioriSome算法的改进
5.1 改进算法的基本思想
5.2 实验过程
5.2.1 实验环境
5.2.2 数据集
5.2.3 读取数据库交易数据
5.2.4 利用改进算法挖掘序列模式
5.3 实验结果分析
5.4 算法对比实验
5.4.1 算法挖掘出的频繁序列的数量
5.4.2 算法的运行时间
5.5 本章小结
结论
参考文献
附录1 统计类代码参照表
附录2 基于Hadoop平台的实验结果
攻读学位期间发表的学术论文
致谢
本文编号:3782065
【文章页数】:66 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 课题研究背景及意义
1.2 国内外研究现状
1.2.1 O2O模式发展现状
1.2.2 序列模式挖掘发展现状
1.3 论文的研究内容及创新点
1.4 论文的组织结构
2 课题理论基础及相关技术
2.1 序列模式挖掘
2.1.1 序列模式挖掘简介
2.1.2 序列模式挖掘算法分类
2.1.3 相关定义
2.1.4 主要性质
2.1.5 AprioriSome算法
2.2 Hadoop大数据平台
2.2.1 Hadoop平台简介
2.2.2 HDFS分布式文件系统
2.2.3 MapReduce分布式计算框架
2.2.4 Yarn通用资源管理器
2.2.5 Hive工具简介
2.3 本章小结
3 数据预处理及初步统计分析
3.1 数据来源及特点分析
3.2 数据预处理
3.3 超市数据的统计分析
3.3.1 用户基本信息统计分析
3.3.2 销售数据统计分析
3.4 本章小结
4 基于Hadoop的序列模式挖掘算法的实现
4.1 数据来源及数据清洗
4.2 Hadoop集群环境的搭建
4.2.1 硬件环境
4.2.2 软件环境
4.3 实验过程
4.4 实验结果分析
4.5 在超市O2O营销领域的应用
4.6 本章小结
5 序列模式挖掘中AprioriSome算法的改进
5.1 改进算法的基本思想
5.2 实验过程
5.2.1 实验环境
5.2.2 数据集
5.2.3 读取数据库交易数据
5.2.4 利用改进算法挖掘序列模式
5.3 实验结果分析
5.4 算法对比实验
5.4.1 算法挖掘出的频繁序列的数量
5.4.2 算法的运行时间
5.5 本章小结
结论
参考文献
附录1 统计类代码参照表
附录2 基于Hadoop平台的实验结果
攻读学位期间发表的学术论文
致谢
本文编号:3782065
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3782065.html
最近更新
教材专著