基于改进ML-KNN算法的网络零售用户细分问题研究
发布时间:2019-09-28 04:56
【摘要】:随着网络零售的不断发展,网络零售市场从卖家导向市场,正逐渐转向买家导向市场。以往网络零售商家更多地依赖价格优惠和流量红利实现销量增长和利润的增加,然而,一方面,网络零售卖家竞争加剧,吸引新顾客的成本不断上升;另一方面,消费者获取价格比对信息更加容易,更容易受到价格的优惠诱惑,也更加容易流失,留住老顾客更加困难。所以,如何对用户进行进一步的用户细分,有针对性的识别用户特征,对用户提出更加精准的营销策略,是网络零售卖家关注的一个重点。本文从某网络零售商家的实际历史订单数据出发,对10000多万条订单数据,进行了随机取样,对取样后的10万条订单数据进行标记学习。首先,通过用户是否发生了二次购买记录,从而对买家是否在该商家进行重复购买进行标记;其次,基于用户享受折扣的金额、享受折扣的次数、累计消费的金额、累计消费的次数、以及金额和次数的占比等指标,结合K-means对用户进行聚类,进而识别价格敏感用户;最后,基于文献回顾,使用经典的RFM模型,从消费者最近一次购买距今时间R,累计购买次数F,累计消费购买金额M,采用K-means聚类,对忠诚用户进行标记。在用户标记的基础上,由于三个标记之间具有一定的相关性。忠诚用户往往更容易发生二次购买,而价格敏感的用户的忠诚度会相对较低,但是价格的波动会影响二次购买的决策。所以,本文对多标记学习进行了系统的文献回顾,并对原有的多标记学习一阶算法ML-KNN算法进行了学习和应用,基于此,提出了两点改进,主要包括第一,由于实际数据往往会存在一定的类别不平衡(class imbalance),本文以标记中大类样本和小类样本的样本数据比例得到权重,从而通过对数据样本加权的方式,提高小类样本的权重,减少小类样本数据的多标记学习错误率,实现样本的均匀抽样,有效的降低类别不平衡问题。第二,由于ML-KNN算法是一阶算法,没有考虑到标记之间的相关性信息,而标记之间的相关性信息可以有效利用,从而提升学习效果,所以本文ML-KNN算法,对分类器函数进行了一定的修改。最终,将改进后的ML-KNN算法和现有多标记学习算法进行了对比,论证了改进的有效性。在结论部分,基于本文对用户的多标记学习,对网络零售卖家的营销策略提出了一些切实可行的建议,并且结合文献回顾,提出了两点不足和三点可供借鉴的未来研究方向。
【图文】:
图1-1本文研究框架逡逑本文研究采用数据挖掘方法作为主要的研究方法,对数据的处理和操作使用逡逑的是MySQLS.邋7软件,并采用Matlab邋2017a进行算法的应用和改进。逡逑数据挖掘化ata邋mining)这个概念最早巧1995年的美国计算机年会上,被提逡逑
具有"经济学","股票相关","国外学者著作"等多个标记,如在生物信息逡逑学中,每个基金可能与一组功能相关联,包括代谢、转录和蛋白质合成。如一个逡逑图片的标记是如图2-1所示的一张图片,那么标记可W是"沙滩"、"海景房"、逡逑"旅游",而"沙滩"往往和"海景房"存在一定的相关性,"沙滩"和"旅游"逡逑也会存在一定相关性。所W多标记学习的标记之间的相关性,可W如下图2-2逡逑所示,标记往往不是单一存在的个体。逡逑和—二—逡逑.:娭-'1逡逑K:逦1邋三V邋‘逡逑图2-1多标记学习图片示例1逡逑(资料来源:百度图片)逡逑(一)问题定义逡逑多标记学习主要思想是:定义X=Rd为示例空间,Y=U,…,Q}为标记集合,逡逑X,为示例(l<i<m),Yi邋为对应义的标记,那么邋D邋二((X,,Y,),(X2,Y2)"‘(Xm,Ym)}逡逑训练集,所W在多标记学习问题中,每个示例与一组标记集有关联性,,因此,多逡逑1百度图片逡逑httvr.//imaae.邋baidu.邋com/search/d(n-ail?cT;-50
【学位授予单位】:南京大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:F724.6;F274
本文编号:2543114
【图文】:
图1-1本文研究框架逡逑本文研究采用数据挖掘方法作为主要的研究方法,对数据的处理和操作使用逡逑的是MySQLS.邋7软件,并采用Matlab邋2017a进行算法的应用和改进。逡逑数据挖掘化ata邋mining)这个概念最早巧1995年的美国计算机年会上,被提逡逑
具有"经济学","股票相关","国外学者著作"等多个标记,如在生物信息逡逑学中,每个基金可能与一组功能相关联,包括代谢、转录和蛋白质合成。如一个逡逑图片的标记是如图2-1所示的一张图片,那么标记可W是"沙滩"、"海景房"、逡逑"旅游",而"沙滩"往往和"海景房"存在一定的相关性,"沙滩"和"旅游"逡逑也会存在一定相关性。所W多标记学习的标记之间的相关性,可W如下图2-2逡逑所示,标记往往不是单一存在的个体。逡逑和—二—逡逑.:娭-'1逡逑K:逦1邋三V邋‘逡逑图2-1多标记学习图片示例1逡逑(资料来源:百度图片)逡逑(一)问题定义逡逑多标记学习主要思想是:定义X=Rd为示例空间,Y=U,…,Q}为标记集合,逡逑X,为示例(l<i<m),Yi邋为对应义的标记,那么邋D邋二((X,,Y,),(X2,Y2)"‘(Xm,Ym)}逡逑训练集,所W在多标记学习问题中,每个示例与一组标记集有关联性,,因此,多逡逑1百度图片逡逑httvr.//imaae.邋baidu.邋com/search/d(n-ail?cT;-50
【学位授予单位】:南京大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:F724.6;F274
本文编号:2543114
本文链接:https://www.wllwen.com/jingjilunwen/xmjj/2543114.html