基于海量零售数据用户画像的推荐算法研究
发布时间:2022-12-11 03:03
在“互联网+”大数据时代下,零售相关数据量累积到30T以上,在整个零售营销过程中,如何挖掘数据的潜在价值,占据着重要地位。因此,针对全国800多万零售户,本文抽样采集零售户的零售动销数据和其他相关信息,对数据进行存储、加工、处理和挖掘。在此基础上,构建多层次多维度用户画像模型,利用改进的FCM算法对用户画像进行聚类分析,结合改进的推荐算法,设计并实现零售信息个性化推荐系统,将本文提出的理论和技术应用在系统中,实现对零售信息的个性化推荐。具体研究内容如下:1)终端信息采集系统进行数据的采集。针对全国800多万零售户分布广、杂乱等问题,通过现场走访的方式采集零售户的零售动销数据,对巡点计划进行改进;针对数据采集区域出现重复采集的问题,在系统中引入百度API定位进行采集优化,提高采集效率和采集数据的质量。2)多途径市场感知信息与数据挖掘过程的分析。将终端信息采集系统、零售订单系统和其他业务系统数据进行整合,对整合后的大规模数据进行统一清洗、集成和转换,按数据的需求建立数据降维模型。引入Hadoop中的Spark分布式对海量数据进行处理、加工等操作,实现企业数据的体系架构,多个系统数据业务共享...
【文章页数】:81 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 用户画像研究现状
1.2.2 个性化推荐算法研究现状
1.3 主要研究内容
1.4 论文组织结构
第二章 相关理论及关键技术的介绍
2.1 数据挖掘相关技术介绍
2.1.1 数据挖掘理论及处理过程
2.1.2 数据挖掘算法及相关优化算法
2.2 用户画像相关介绍
2.2.1 用户画像概念
2.2.2 用户画像标签体系
2.2.3 用户画像构建方法
2.3 推荐算法相关介绍
2.3.1 基于项目的K近邻算法
2.3.2 基于用户的协同过滤算法
2.4 本章小结
第三章 海量零售数据的采集与处理
3.1 海量零售户数据的采集
3.1.1 数据来源
3.1.2 终端数据聚类采集及巡点计划改进
3.1.3 基于百度API定位终端数据采集改进
3.2 数据预处理
3.2.1 数据清洗
3.2.2 数据集成与转换
3.3 分布式海量数据处理
3.4 本章小结
第四章 多层次用户画像数学模型的建立与研究
4.1 用户画像指标体系
4.2 多层次多维度用户画像建模
4.3 群组用户画像模型构建
4.3.1 基于FCM算法的用户画像模型聚类
4.3.2 优化改进FCM聚类算法
4.4 实验结果及其分析
4.4.1 实验标准数据集
4.4.2 实验环境
4.4.3 实验结果
4.5 本章小结
第五章 基于离散量和用户偏好相似度修正的推荐算法研究
5.1 传统相似度问题
5.2 传统相似度的改进
5.2.1 离散量的定义
5.2.2 离散量的相似度修正
5.2.3 用户偏好相似度修正
5.2.4 基于离散量和用户偏好的相似度辅助修正
5.3 基于离散量和用户偏好相似度修正的推荐算法
5.4 实验结果及其分析
5.4.1 实验标准数据集
5.4.2 实验环境和度量标准
5.4.3 实验结果
5.5 本章小结
第六章 零售信息个性化推荐系统实现与结果分析
6.1 系统的总体设计
6.1.1 系统架构设计
6.1.2 软件架构设计
6.2 主要功能模块设计与展现
6.2.1 系统的总体架构图
6.2.2 零售数据采集模块
6.2.3 用户画像构建模块
6.2.4 推荐结果展示模块
6.3 应用结果分析
6.4 本章小结
第七章 总结与展望
7.1 本文工作总结
7.2 研究展望
参考文献
致谢
攻读学位期间的研究成果
【参考文献】:
期刊论文
[1]“新零售”的理论架构与研究范式[J]. 王坤,相峰. 中国流通经济. 2018(01)
[2]基于用户画像的信息智能推送方法[J]. 姜建武,李景文,陆妍玲,叶良松. 微型机与应用. 2016(23)
[3]基于微博的大数据用户画像与精准营销[J]. 曾鸿,吴苏倪. 现代经济信息. 2016(16)
[4]基于中点密度函数的模糊聚类算法[J]. 周跃跃,胡婕,苏涛. 计算机应用. 2016(01)
[5]基于“用户画像”挖掘的精准营销细分模型研究[J]. 刘海,卢慧,阮金花,田丙强,胡守忠. 丝绸. 2015(12)
[6]一种改进的FCM算法及仿真实验研究[J]. 刘杰. 陕西理工学院学报(自然科学版). 2015(04)
[7]基于用户属性和评分的协同过滤推荐算法[J]. 丁少衡,姬东鸿,王路路. 计算机工程与设计. 2015(02)
[8]面向微博系统的实时个性化推荐[J]. 高明,金澈清,钱卫宁,王晓玲,周傲英. 计算机学报. 2014(04)
[9]基于核方法的User-Based协同过滤推荐算法[J]. 王鹏,王晶晶,俞能海. 计算机研究与发展. 2013(07)
[10]基于马氏距离特征加权的模糊聚类新算法[J]. 蔡静颖,谢福鼎,张永. 计算机工程与应用. 2012(05)
硕士论文
[1]基于改进FCM算法的隐性知识外显案例聚类研究[D]. 赵亚敏.郑州大学 2018
[2]基于大数据平台的企业竞争情报系统设计及应用研究[D]. 王勇.昆明理工大学 2018
[3]基于FCM聚类的品牌状态判别模型的研究[D]. 沈红红.浙江理工大学 2018
[4]基于用户画像的WordPress博文推荐研究[D]. 赵荣霞.北京交通大学 2018
[5]基于数据挖掘的销售预警模型分析与研究[D]. 黄嘉发.浙江理工大学 2018
[6]基于海量数据的市场投放策略研究[D]. 张琳.浙江理工大学 2018
[7]移动环境下的零售信息采集分析与营销业务模型构建[D]. 王勇强.浙江理工大学 2018
[8]基于移动终端个性化推送服务的研究与实现[D]. 王跃跃.浙江理工大学 2018
[9]基于零售信息挖掘下面向消费市场的精准推送模型设计与研究[D]. 姚龙飞.浙江理工大学 2018
[10]基于群组用户画像的农业信息化推荐算法研究[D]. 贾伟洋.西北农林科技大学 2017
本文编号:3718017
【文章页数】:81 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 用户画像研究现状
1.2.2 个性化推荐算法研究现状
1.3 主要研究内容
1.4 论文组织结构
第二章 相关理论及关键技术的介绍
2.1 数据挖掘相关技术介绍
2.1.1 数据挖掘理论及处理过程
2.1.2 数据挖掘算法及相关优化算法
2.2 用户画像相关介绍
2.2.1 用户画像概念
2.2.2 用户画像标签体系
2.2.3 用户画像构建方法
2.3 推荐算法相关介绍
2.3.1 基于项目的K近邻算法
2.3.2 基于用户的协同过滤算法
2.4 本章小结
第三章 海量零售数据的采集与处理
3.1 海量零售户数据的采集
3.1.1 数据来源
3.1.2 终端数据聚类采集及巡点计划改进
3.1.3 基于百度API定位终端数据采集改进
3.2 数据预处理
3.2.1 数据清洗
3.2.2 数据集成与转换
3.3 分布式海量数据处理
3.4 本章小结
第四章 多层次用户画像数学模型的建立与研究
4.1 用户画像指标体系
4.2 多层次多维度用户画像建模
4.3 群组用户画像模型构建
4.3.1 基于FCM算法的用户画像模型聚类
4.3.2 优化改进FCM聚类算法
4.4 实验结果及其分析
4.4.1 实验标准数据集
4.4.2 实验环境
4.4.3 实验结果
4.5 本章小结
第五章 基于离散量和用户偏好相似度修正的推荐算法研究
5.1 传统相似度问题
5.2 传统相似度的改进
5.2.1 离散量的定义
5.2.2 离散量的相似度修正
5.2.3 用户偏好相似度修正
5.2.4 基于离散量和用户偏好的相似度辅助修正
5.3 基于离散量和用户偏好相似度修正的推荐算法
5.4 实验结果及其分析
5.4.1 实验标准数据集
5.4.2 实验环境和度量标准
5.4.3 实验结果
5.5 本章小结
第六章 零售信息个性化推荐系统实现与结果分析
6.1 系统的总体设计
6.1.1 系统架构设计
6.1.2 软件架构设计
6.2 主要功能模块设计与展现
6.2.1 系统的总体架构图
6.2.2 零售数据采集模块
6.2.3 用户画像构建模块
6.2.4 推荐结果展示模块
6.3 应用结果分析
6.4 本章小结
第七章 总结与展望
7.1 本文工作总结
7.2 研究展望
参考文献
致谢
攻读学位期间的研究成果
【参考文献】:
期刊论文
[1]“新零售”的理论架构与研究范式[J]. 王坤,相峰. 中国流通经济. 2018(01)
[2]基于用户画像的信息智能推送方法[J]. 姜建武,李景文,陆妍玲,叶良松. 微型机与应用. 2016(23)
[3]基于微博的大数据用户画像与精准营销[J]. 曾鸿,吴苏倪. 现代经济信息. 2016(16)
[4]基于中点密度函数的模糊聚类算法[J]. 周跃跃,胡婕,苏涛. 计算机应用. 2016(01)
[5]基于“用户画像”挖掘的精准营销细分模型研究[J]. 刘海,卢慧,阮金花,田丙强,胡守忠. 丝绸. 2015(12)
[6]一种改进的FCM算法及仿真实验研究[J]. 刘杰. 陕西理工学院学报(自然科学版). 2015(04)
[7]基于用户属性和评分的协同过滤推荐算法[J]. 丁少衡,姬东鸿,王路路. 计算机工程与设计. 2015(02)
[8]面向微博系统的实时个性化推荐[J]. 高明,金澈清,钱卫宁,王晓玲,周傲英. 计算机学报. 2014(04)
[9]基于核方法的User-Based协同过滤推荐算法[J]. 王鹏,王晶晶,俞能海. 计算机研究与发展. 2013(07)
[10]基于马氏距离特征加权的模糊聚类新算法[J]. 蔡静颖,谢福鼎,张永. 计算机工程与应用. 2012(05)
硕士论文
[1]基于改进FCM算法的隐性知识外显案例聚类研究[D]. 赵亚敏.郑州大学 2018
[2]基于大数据平台的企业竞争情报系统设计及应用研究[D]. 王勇.昆明理工大学 2018
[3]基于FCM聚类的品牌状态判别模型的研究[D]. 沈红红.浙江理工大学 2018
[4]基于用户画像的WordPress博文推荐研究[D]. 赵荣霞.北京交通大学 2018
[5]基于数据挖掘的销售预警模型分析与研究[D]. 黄嘉发.浙江理工大学 2018
[6]基于海量数据的市场投放策略研究[D]. 张琳.浙江理工大学 2018
[7]移动环境下的零售信息采集分析与营销业务模型构建[D]. 王勇强.浙江理工大学 2018
[8]基于移动终端个性化推送服务的研究与实现[D]. 王跃跃.浙江理工大学 2018
[9]基于零售信息挖掘下面向消费市场的精准推送模型设计与研究[D]. 姚龙飞.浙江理工大学 2018
[10]基于群组用户画像的农业信息化推荐算法研究[D]. 贾伟洋.西北农林科技大学 2017
本文编号:3718017
本文链接:https://www.wllwen.com/guanlilunwen/yingxiaoguanlilunwen/3718017.html