基于数据挖掘的高潜用户购买意向预测
发布时间:2024-03-25 23:36
近年来,“大数据”一词吸引了众多学者和企业管理者的目光,海量数据的出现开启了一次重大的时代转型。大数据时代的来临,使得无论是医疗、教育、商业还是其他领域,都逐渐要求人们用大数据思维处理和分析日益庞大的数据资源。国内外学者纷纷提出针对大数据的研究方法及应用实例,企业也将注意力和资源转向开发基于大数据的产品研究中,互联网电子商务行业就是其中受影响较大的领域之一。京东于2004年1月正式涉足电子商务领域,近年来发展尤为迅速,现已成为全国最大的自营式综合网络零售商。随着平台知名度的提高以及规模的增大,用户量急剧增长,目前京东商城已经积累了大量的用户网络数据,如何从海量数据中找到有价值的信息,去预测消费者未来的购买意向,是京东商城也是整个电子商务领域利用大数据解决精准营销问题的关键。本研究以京东商城用户真实的行为数据为基础,前期本文以特征工程为研究重点,借助Hive SQL从Hadoop集群中提取数据,并分析确定646维特征,为模型预测打下良好的基础;其次借助Apache Spark完成对数据的处理与计算,基于逻辑回归算法搭建了用于预测用户购买意向的短期意图模型,输出用户购买某种品类的预测概率,...
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
本文编号:3939019
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
图2-1用户年龄分布??-
用户下单前5天的6种行为统计,用户下单前5天要对要购买商品的点击次??数,用户下单前将商品加入购物车的人数统计。??图2-1的横轴表示年龄段,纵轴表示各年龄段对应的人数占比,从图中可以??看出,用户年龄集中分布在26-35岁,占总下单用户的56.23%,其次是19-25岁??和3....
图2-2用户等级分布??
?5??图2-2用户等级分布??图2-3所示为用户注册两周内的下单人数,横轴为距离注册日的时间间隔,??纵轴为统计人数。由图可知,在注册日当天就有下单行为的用户数最多,约占总??人数的32.63%,在注册日当天过后下单的人数占比急剧下降,在注册一周内下??单的用户数较多,注册一周....
图2-3用户注册两周内的下单人数统计??
?4?5??图2-2用户等级分布??图2-3所示为用户注册两周内的下单人数,横轴为距离注册日的时间间隔,??纵轴为统计人数。由图可知,在注册日当天就有下单行为的用户数最多,约占总??人数的32.63%,在注册日当天过后下单的人数占比急剧下降,在注册一周内下??单的用户数较多,注册....
图24用户下单前5天的6种行为统计??
图24用户下单前5天的6种行为统计??-5横轴是用户下单前5天点击要购买的商品的次数,纵轴,如用户下单前5天,约有75人对要购买的商品点击了?4次数集中在3-6次,该统计数据在用户中表现出了差异性,一
本文编号:3939019
本文链接:https://www.wllwen.com/jingjilunwen/guojimaoyilunwen/3939019.html