基于数据挖掘的某电商商品销售研究
发布时间:2021-08-23 10:17
在电子商务环境下,企业竞争日趋激烈,要想在市场占据有利地位,需要对商品竞争力进行准确的预测与判断,合理的预测不仅将带来巨大的经济效益,也会保持市场的稳定发展。商品组合与销量预测问题是电子商务的核心内容。如基于用户已购买商品向其推荐可能购买的商品,从而促进商品销售;商品销售预测使公司能够做出明智的业务决策并预测短期和长期业绩。本文以电商店铺销售数据、订单数据为研究对象,探究店铺商品组合与未来销量,主要研究内容如下:(1)复购率体现商品或服务的用户黏性,对于企业而言尤其重要,探究商品复购率的强影响因素,对于促进商品销售、销量预测都存在关键意义。首先对数值进行聚类,对聚类后的各类别使用逐步回归筛选最优变量并拟合泊松回归模型,探讨案例中不同商品的复购率与对复购率起强影响作用因素关系。(2)商品组合搭配具有广泛应用,如基于用户已购买商品向其推荐可能购买的商品,从而促进商品销售。使用关联规则、基于关联规则与遗传算法的商品组合方法以及引入复购情况作为商品组合模式评分改进的协同过滤算法以探究商品组合搭配。(3)为了预测商品销量,结合BP神经网络、LSTM神经网络、Verhulst灰色模型三种算法的优点...
【文章来源】:青岛大学山东省
【文章页数】:72 页
【学位级别】:硕士
【部分图文】:
自变量相关系数图
青岛大学硕士学士论文10应注意变量之间的相关关系。图2.1自变量相关系数图2、泊松回归特征分析前文已提到不同商品间复购频数特异性极强,无法拟合一个统一的泊松回归模型,因此使用聚类分析分类,对聚类后结果拟合泊松回归模型,更有利于响应变量月复购频数的预测。使用肘部法则确定最佳聚类数目,由图2.2看出,当k取到3时,平均畸变程度的改善效果不断减弱。因此最终将数据划分为3类。图2.2肘部法则图
青岛大学硕士学士论文12泊松回归拟合方式如下:对于收集到的响应变量-自变量数据,首先根据数据集进行K-means聚类,得到各类别数据集;将各类数据集中分类变量转换为虚拟变量,对变量进行逐步回归,筛选出最优变量集合;将数值按0.85:0.15的比例选取训练集与测试集,采用各类别特有的最优变量拟合泊松回归模型,使用十折交叉验证和统计量RMSE测试模型精确度;最终利用各类模型进行复购频数预测。(1)聚类一结果经过逐步回归,聚类一最终筛选出的预测变量为:月购买数量、是否活动、活动次数、直径、着色内径、着色外径、季度与花色。利用月复购频数与最终筛选出的预测变量拟合泊松回归模型,按0.85:0.15的比例抽取出训练集与测试集,并对训练集进行十折交叉验证探究模型精确度,十折平均RMSE结果为6.150821,证明该泊松回归模型精确度较好。利用该泊松回归模型对测试集进行预测,预测值及其与真值的绝对误差见图2.3,预测的RMSE与MAE结果见表2.9,从表2.9看出,该回归模型对应的RMSE、MAE较小,由图2.3可以看出,该回归模型对于极值点预测能力一般,绝对误差较大,但整体而言该回归模型预测结果表现较好。表2.9聚类一回归模型预测能力指标统计类别RMSE结果MAE结果16.1691832.411765图2.3聚类一泊松回归预测绝对误差结果图
【参考文献】:
期刊论文
[1]卷烟销量组合预测模型研究[J]. 吴明山,王冰,起亚宁,郑飘. 中国烟草学报. 2019(03)
[2]基于时间序列的商店商品连续时期的销量预测及分析[J]. 赵伊婷. 科技经济导刊. 2018(33)
[3]基于ARMA模型的农产品电商销售额分析与预测——来自陇南市数据的Eviews8.0实证[J]. 王胜青. 甘肃高师学报. 2017(09)
[4]基于关联规则的电商产品组合销售热点研究[J]. 刘玉林. 浙江理工大学学报(社会科学版). 2016(06)
[5]基于BP神经网络的网店销售预测模型研究[J]. 翁莹晶,冯慧斌. 闽江学院学报. 2016(05)
[6]基于深度学习的线上农产品销量预测模型研究[J]. 刘晶,和述群,朱清香,安雅程,许楠,刘凯. 计算机应用研究. 2017(08)
[7]基于灰色理论与RBF算法的电子商务交易额预测研究[J]. 李洪磊,王德闯. 物流科技. 2016(06)
[8]基于用户特征和商品特征的组合协同过滤算法[J]. 孟庆庆,张胜男,卢楚雍. 软件导刊. 2015(03)
[9]基于R语言的Apriori算法在挖掘商品交易数据中的应用[J]. 赵北庚. 电脑编程技巧与维护. 2015(02)
[10]基于关联分析的多目标商品组合选择方法[J]. 张志宏,寇纪淞,陈富赞,李敏强. 系统工程学报. 2011(01)
硕士论文
[1]基于LSTM神经网络的电商需求预测的研究[D]. 王渊明.山东大学 2018
[2]基于卷积神经网络的电商数据深度挖掘[D]. 钊魁.浙江大学 2017
本文编号:3357675
【文章来源】:青岛大学山东省
【文章页数】:72 页
【学位级别】:硕士
【部分图文】:
自变量相关系数图
青岛大学硕士学士论文10应注意变量之间的相关关系。图2.1自变量相关系数图2、泊松回归特征分析前文已提到不同商品间复购频数特异性极强,无法拟合一个统一的泊松回归模型,因此使用聚类分析分类,对聚类后结果拟合泊松回归模型,更有利于响应变量月复购频数的预测。使用肘部法则确定最佳聚类数目,由图2.2看出,当k取到3时,平均畸变程度的改善效果不断减弱。因此最终将数据划分为3类。图2.2肘部法则图
青岛大学硕士学士论文12泊松回归拟合方式如下:对于收集到的响应变量-自变量数据,首先根据数据集进行K-means聚类,得到各类别数据集;将各类数据集中分类变量转换为虚拟变量,对变量进行逐步回归,筛选出最优变量集合;将数值按0.85:0.15的比例选取训练集与测试集,采用各类别特有的最优变量拟合泊松回归模型,使用十折交叉验证和统计量RMSE测试模型精确度;最终利用各类模型进行复购频数预测。(1)聚类一结果经过逐步回归,聚类一最终筛选出的预测变量为:月购买数量、是否活动、活动次数、直径、着色内径、着色外径、季度与花色。利用月复购频数与最终筛选出的预测变量拟合泊松回归模型,按0.85:0.15的比例抽取出训练集与测试集,并对训练集进行十折交叉验证探究模型精确度,十折平均RMSE结果为6.150821,证明该泊松回归模型精确度较好。利用该泊松回归模型对测试集进行预测,预测值及其与真值的绝对误差见图2.3,预测的RMSE与MAE结果见表2.9,从表2.9看出,该回归模型对应的RMSE、MAE较小,由图2.3可以看出,该回归模型对于极值点预测能力一般,绝对误差较大,但整体而言该回归模型预测结果表现较好。表2.9聚类一回归模型预测能力指标统计类别RMSE结果MAE结果16.1691832.411765图2.3聚类一泊松回归预测绝对误差结果图
【参考文献】:
期刊论文
[1]卷烟销量组合预测模型研究[J]. 吴明山,王冰,起亚宁,郑飘. 中国烟草学报. 2019(03)
[2]基于时间序列的商店商品连续时期的销量预测及分析[J]. 赵伊婷. 科技经济导刊. 2018(33)
[3]基于ARMA模型的农产品电商销售额分析与预测——来自陇南市数据的Eviews8.0实证[J]. 王胜青. 甘肃高师学报. 2017(09)
[4]基于关联规则的电商产品组合销售热点研究[J]. 刘玉林. 浙江理工大学学报(社会科学版). 2016(06)
[5]基于BP神经网络的网店销售预测模型研究[J]. 翁莹晶,冯慧斌. 闽江学院学报. 2016(05)
[6]基于深度学习的线上农产品销量预测模型研究[J]. 刘晶,和述群,朱清香,安雅程,许楠,刘凯. 计算机应用研究. 2017(08)
[7]基于灰色理论与RBF算法的电子商务交易额预测研究[J]. 李洪磊,王德闯. 物流科技. 2016(06)
[8]基于用户特征和商品特征的组合协同过滤算法[J]. 孟庆庆,张胜男,卢楚雍. 软件导刊. 2015(03)
[9]基于R语言的Apriori算法在挖掘商品交易数据中的应用[J]. 赵北庚. 电脑编程技巧与维护. 2015(02)
[10]基于关联分析的多目标商品组合选择方法[J]. 张志宏,寇纪淞,陈富赞,李敏强. 系统工程学报. 2011(01)
硕士论文
[1]基于LSTM神经网络的电商需求预测的研究[D]. 王渊明.山东大学 2018
[2]基于卷积神经网络的电商数据深度挖掘[D]. 钊魁.浙江大学 2017
本文编号:3357675
本文链接:https://www.wllwen.com/jingjilunwen/dianzishangwulunwen/3357675.html