两步聚类和关联规则结合的推荐算法在医药电商中的应用
发布时间:2021-03-10 20:16
随着互联网时代的到来,电子商务迅猛发展,电商平台上的商品越来越丰富,从刚开始兴起的日用百货、食品,到现在生鲜水果、医药产品、保险等。对于消费者而言,如何在数以万计的产品中挑选自己喜欢的产品?对于商家而言,如何将自己的产品推荐给消费者?为了解决这些问题,个性化推荐系统运用而生,并且随着不断的研究发展,个性化推荐算法的精准性得到很大的提高。本文主要以关联规则为基础研究推荐算法,为提高关联规则推荐有效性,从两个方面着手解决问题:第一,在使用关联规则挖掘之前,用两步聚类对数据进行预处理,针对数据的稀疏性导致项目无法出现在关联规则的关联关系中的问题,采用两步聚类将消费行为相似的用户聚为一类,可改善用户行为数据稀疏的问题,提高项目出现在关联关系中的可能性;第二,提出了调整加权Apriori算法,该算法根据项目的重要程度对项目加权,并在NewApriori算法的基础上对加权支持度和加权置信度计算公式进行调整,改善了 NewApriori算法中加权置信度计算时权重抵消的问题。本文结合医药电商平台数据实现了两步聚类与关联规则结合的个性化推荐,通过聚类分析将消费...
【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
图2.2?CF插入过程??2.?2.?2聚类阶段??
科学位论文??MASTER'S?THESIS??筛选强关联规则,关联规则{103卜>{101}、{104}=>{101}、U03,104}=>{101}、??{103}=>{101,104}、{104}=>{101,103丨满足大于等于加权最小置信度0.?2和加权最??小支持度1/15,成为强关联规则。??3.?7基于关联规则算法的推荐??3.?7.1基于关联规则算法推荐流程??如图3.1所示,关联规则的推荐以用户历史交易数据集为基础,用关联规则算??法产生频繁项集,根据频繁项集生成关联规则,最终产生推荐关系。在推荐过程中??采用不同的关联规则算法,推荐的效果也不同,本文主要研宄在事务数据集中项目??重要性不等的情况,提出采用加权关联规则进行推荐,旨提高重要的项目在关联规??则中的出现的可能性。??/*???\?-V?,?■?1?、?A??用户交易数据集发现颉f顶集?_?生成关联规则??产生推荐关系???/??/??/?V????图3.1关联规则推荐流程图??3.?7.?2推荐测评指标??测评指标可用于评价推荐系统各个方面的性能,通常不同类型的推荐系统推荐??测评指标也略有不同,在电商推荐系统中常用的指标有:??(1)准确率准确率是反映在所有的推荐列表中用户实际交互的??项目所占的比例。设推荐项的集合为Lt/,用户实际交互项的集合为加〇?的??值越接近1,代表该推荐模型的准确率越高。推荐准确率()计算公式3.?10??如下所示:??Precision?=?\LbnBU\.?公式?3.?10??丨叫??(2)召回率(办ca//)。召回率反映的是在用户实际交互的项目中推荐列表的??推
领士学位论文??MASTER'S?THESIS??数据和购买药品类型数据为基础,通过两步聚类算法将用户分类,最终每个用户都??有自己的类别标签。??在SPSS中对21588位会员进行两步聚类,聚类结果如图4.?1所示,输入17个??特征变量,将用户聚为6类,聚类质量显示聚类分析尚可,聚类结果记为r义:,??7'5〇{7^,<^},其中7^?=〈/,气〉,/?=?1,2,..-,21588,)=?1,2广-,6。4表示第/位会员,?表??示两步聚类得到的类,rc表示两步聚类将会员聚到哪个类别。cp=<c7,a>,??A-?=?1,2,...,W,表示会员购买的医药产品,CP表示每个类&与医药产品之间的关??系。??模型概要??箅法两歩??输入17??聚类6??聚类质量???????-1.0?-0.5?0.0?0.5?1.0??凝聚和分转的轮抱測绝??图4.?1两步聚类模型概要??聚类分布如表4.5所示,第一类用户^数量较少,仅占用户量的2.7%,c6类别??用户量次之,占总用户的9.?6%,其余4类用户数量较均匀。??表4.?5两步聚类分布??聚类分布??占组合的踩分?占S计的锊分??个案数?比?比??1?590?2.7%?2.7%??2?4263??19.7%?_?1^9.7%??3?3357?15.6%?15.6%??4?601?6?27.9%?27.9%??5?__5294??24.5%?24.5%??6?_2068?9.6%?9.6%??组合?_21588?100.0%?__?100.0%??一??21568?10
【参考文献】:
期刊论文
[1]一种多层多维的关联规则挖掘算法在推荐系统中的应用[J]. 黎丹雨,陈怡华. 计算机与现代化. 2019(06)
[2]DBSCAN算法研究及并行化实现[J]. 宋董飞,徐华. 计算机工程与应用. 2018(24)
[3]基于深度学习的推荐系统研究综述[J]. 黄立威,江碧涛,吕守业,刘艳博,李德毅. 计算机学报. 2018(07)
[4]大数据挖掘在高校图书馆个性化服务中应用研究[J]. 柳益君,何胜,冯新翎,武群辉,熊太纯. 图书馆工作与研究. 2017(05)
[5]基于改进的SOM聚类连续属性离散化算法[J]. 陶刚,闫永刚,刘俊,邹娇. 计算机应用. 2015(S1)
[6]混合属性数据k-prototypes聚类算法[J]. 余文利,余建军,方建文. 计算机系统应用. 2015(06)
[7]协同过滤推荐技术综述[J]. 冷亚军,陆青,梁昌勇. 模式识别与人工智能. 2014(08)
[8]基于用户相似度的协同过滤推荐算法[J]. 荣辉桂,火生旭,胡春华,莫进侠. 通信学报. 2014(02)
[9]基于Apriori算法的水平加权关联规则挖掘[J]. 张智军,方颖,许云涛. 计算机工程与应用. 2003(14)
[10]加权关联规则挖掘算法的研究[J]. 陆建江. 计算机研究与发展. 2002(10)
博士论文
[1]协同过滤推荐算法的关键性问题研究[D]. 黄山山.山东大学 2016
[2]模糊聚类算法研究[D]. 曾山.华中科技大学 2012
硕士论文
[1]基于链接改进的BIRCH算法的研究与应用[D]. 陈婧文.吉林大学 2019
[2]基于关联规则和聚类分析的个性化推荐系统的研究与实现[D]. 孙世文.吉林大学 2015
[3]基于数据挖掘的视频推荐系统建模研究[D]. 谢发川.电子科技大学 2012
本文编号:3075224
【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
图2.2?CF插入过程??2.?2.?2聚类阶段??
科学位论文??MASTER'S?THESIS??筛选强关联规则,关联规则{103卜>{101}、{104}=>{101}、U03,104}=>{101}、??{103}=>{101,104}、{104}=>{101,103丨满足大于等于加权最小置信度0.?2和加权最??小支持度1/15,成为强关联规则。??3.?7基于关联规则算法的推荐??3.?7.1基于关联规则算法推荐流程??如图3.1所示,关联规则的推荐以用户历史交易数据集为基础,用关联规则算??法产生频繁项集,根据频繁项集生成关联规则,最终产生推荐关系。在推荐过程中??采用不同的关联规则算法,推荐的效果也不同,本文主要研宄在事务数据集中项目??重要性不等的情况,提出采用加权关联规则进行推荐,旨提高重要的项目在关联规??则中的出现的可能性。??/*???\?-V?,?■?1?、?A??用户交易数据集发现颉f顶集?_?生成关联规则??产生推荐关系???/??/??/?V????图3.1关联规则推荐流程图??3.?7.?2推荐测评指标??测评指标可用于评价推荐系统各个方面的性能,通常不同类型的推荐系统推荐??测评指标也略有不同,在电商推荐系统中常用的指标有:??(1)准确率准确率是反映在所有的推荐列表中用户实际交互的??项目所占的比例。设推荐项的集合为Lt/,用户实际交互项的集合为加〇?的??值越接近1,代表该推荐模型的准确率越高。推荐准确率()计算公式3.?10??如下所示:??Precision?=?\LbnBU\.?公式?3.?10??丨叫??(2)召回率(办ca//)。召回率反映的是在用户实际交互的项目中推荐列表的??推
领士学位论文??MASTER'S?THESIS??数据和购买药品类型数据为基础,通过两步聚类算法将用户分类,最终每个用户都??有自己的类别标签。??在SPSS中对21588位会员进行两步聚类,聚类结果如图4.?1所示,输入17个??特征变量,将用户聚为6类,聚类质量显示聚类分析尚可,聚类结果记为r义:,??7'5〇{7^,<^},其中7^?=〈/,气〉,/?=?1,2,..-,21588,)=?1,2广-,6。4表示第/位会员,?表??示两步聚类得到的类,rc表示两步聚类将会员聚到哪个类别。cp=<c7,a>,??A-?=?1,2,...,W,表示会员购买的医药产品,CP表示每个类&与医药产品之间的关??系。??模型概要??箅法两歩??输入17??聚类6??聚类质量???????-1.0?-0.5?0.0?0.5?1.0??凝聚和分转的轮抱測绝??图4.?1两步聚类模型概要??聚类分布如表4.5所示,第一类用户^数量较少,仅占用户量的2.7%,c6类别??用户量次之,占总用户的9.?6%,其余4类用户数量较均匀。??表4.?5两步聚类分布??聚类分布??占组合的踩分?占S计的锊分??个案数?比?比??1?590?2.7%?2.7%??2?4263??19.7%?_?1^9.7%??3?3357?15.6%?15.6%??4?601?6?27.9%?27.9%??5?__5294??24.5%?24.5%??6?_2068?9.6%?9.6%??组合?_21588?100.0%?__?100.0%??一??21568?10
【参考文献】:
期刊论文
[1]一种多层多维的关联规则挖掘算法在推荐系统中的应用[J]. 黎丹雨,陈怡华. 计算机与现代化. 2019(06)
[2]DBSCAN算法研究及并行化实现[J]. 宋董飞,徐华. 计算机工程与应用. 2018(24)
[3]基于深度学习的推荐系统研究综述[J]. 黄立威,江碧涛,吕守业,刘艳博,李德毅. 计算机学报. 2018(07)
[4]大数据挖掘在高校图书馆个性化服务中应用研究[J]. 柳益君,何胜,冯新翎,武群辉,熊太纯. 图书馆工作与研究. 2017(05)
[5]基于改进的SOM聚类连续属性离散化算法[J]. 陶刚,闫永刚,刘俊,邹娇. 计算机应用. 2015(S1)
[6]混合属性数据k-prototypes聚类算法[J]. 余文利,余建军,方建文. 计算机系统应用. 2015(06)
[7]协同过滤推荐技术综述[J]. 冷亚军,陆青,梁昌勇. 模式识别与人工智能. 2014(08)
[8]基于用户相似度的协同过滤推荐算法[J]. 荣辉桂,火生旭,胡春华,莫进侠. 通信学报. 2014(02)
[9]基于Apriori算法的水平加权关联规则挖掘[J]. 张智军,方颖,许云涛. 计算机工程与应用. 2003(14)
[10]加权关联规则挖掘算法的研究[J]. 陆建江. 计算机研究与发展. 2002(10)
博士论文
[1]协同过滤推荐算法的关键性问题研究[D]. 黄山山.山东大学 2016
[2]模糊聚类算法研究[D]. 曾山.华中科技大学 2012
硕士论文
[1]基于链接改进的BIRCH算法的研究与应用[D]. 陈婧文.吉林大学 2019
[2]基于关联规则和聚类分析的个性化推荐系统的研究与实现[D]. 孙世文.吉林大学 2015
[3]基于数据挖掘的视频推荐系统建模研究[D]. 谢发川.电子科技大学 2012
本文编号:3075224
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3075224.html
最近更新
教材专著