基于聚类的电子商务推荐系统研究
本文关键词:基于聚类的电子商务推荐系统研究
更多相关文章: 推荐系统 协同过滤 聚类 粒子群优化 信息熵
【摘要】:互联网和移动互联网的不断普及和深入发展造就了当下的大数据时代。数据量的增长在电子商务领域的体现尤为明显,这为今后的发展提供了更多契机,但也产生了信息过载这样的问题,即用户无法从海量的商品信息中快速、准确地获取到真正感兴趣的需求信息,在这一背景下推荐系统应运而生。协同过滤算法是推荐系统中应用最为广泛的技术,但是在实际应用中也存在如实时性差、准确率不高、冷启动和数据稀疏等问题。近来关于推荐系统的研究中,一些学者提出引入聚类技术来解决以上部分问题。基于聚类的推荐算法通过先对用户或者项目进行聚类划分,使得相似度较高的对象聚集到同一个类簇中,从而简化查找最近邻居的过程,大大减小了整体计算复杂度和时间消耗。另外由于聚类过程可以在线下完成,所以大大提升了推荐系统整体的实时响应性。本文对聚类技术和推荐系统做了一定理论研究,针对基于K-means的聚类推荐算法提出了4点算法改进,并通过实验验证了改进的有效性。本文主要研究内容为:(1)利用基于信息熵的权值优化传统欧氏距离的计算方式,来改进K-means算法,使之在对用户的聚类过程中能更精确的计算用户间的相似度,优化最终的聚类划分结果;利用指数函数优化粒子群算法中粒子的个体学习因子和群体学习因子取值方式,增强粒子的学习能力;利用对数变化规律优化粒子群算法中粒子速度的更新方式,提高算法的最优解搜索能力和算法收敛性。将改进的K-means和改进的PSO算法相结合,提出改进的混合聚类算法Ajusted PSO-Kmeans算法。(2)将基于信息熵的权值引入基于用户的协同过滤算法的Pearson相关系数计算方式中以改进UCF算法,使之在查找最近邻居的过程中消除用户评分向量间的量纲化差异,有利于找到兴趣偏好更相似的最近邻居。将改进的PSO-Kmeans混合聚类算法和改进的UCF算法相结合,提出了改进的基于混合聚类的推荐算法A-UCCF算法。(3)设计实现了三个实验:其一,在实验数据集Iris和Wine上验证了本文提出的Ajusted PSO-Kmeans混合聚类算法相比K-means、PSO-Kmeans算法具有更好的聚类质量和划分准确性。其二,在实验数据集MovieLens上验证了本文提出的A-UCCF算法相比UCF、UCCF算法具有更好的推荐准确性。其三,在第二个实验基础上利用查找效率指标验证了A-UCCF算法比UCF、UCCF算法具有更高的实时响应性。
【学位授予单位】:华东师范大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.3
【相似文献】
中国期刊全文数据库 前10条
1 孙吉贵;刘杰;赵连宇;;聚类算法研究[J];软件学报;2008年01期
2 于慧娟;崔军;毋晓志;李伟;;一种改进的凝聚图聚类方法[J];山西煤炭管理干部学院学报;2010年03期
3 于剑,程乾生;模糊聚类方法中的最佳聚类数的搜索范围[J];中国科学E辑:技术科学;2002年02期
4 崔军;郭春艳;贾宗维;;一种连通非加权图的快速聚类方法[J];计算机工程与应用;2008年07期
5 岳清华;郑刚;;一种动态心电图波形聚类策略的研究[J];天津理工大学学报;2008年01期
6 王士同;陈晓峰;曹苏群;钟富礼;;基于力的类同传播聚类方法[J];江南大学学报(自然科学版);2009年04期
7 张逸清;刘文才;;聚类数的确定[J];计算机与数字工程;2007年02期
8 程慈;柴瑞敏;;聚类数的自动确定[J];科技信息(科学教研);2008年14期
9 刘燕驰;;基于密度的最佳聚类数确定方法[J];中国管理信息化;2011年09期
10 朱明;王俊普;;一种聚类学习的新方法[J];模式识别与人工智能;2000年03期
中国重要会议论文全文数据库 前9条
1 高翠芳;吴小俊;;基于二阶差分的聚类数自动确定方法[A];江苏省系统工程学会第十一届学术年会论文集[C];2009年
2 刘洋;江志纲;丁增喜;王大玲;鲍玉斌;于戈;;一种基于图的聚类算法GB-Cluster[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
3 李浪波;傅彦;刘红;;基于范例推理的网格和密度聚类算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
4 娄冬梅;陈明;朱有娜;;一种基于密度的无参数聚类算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
5 魏昕路;洪志令;姜青山;;一种基于样本缩减策略的新窗口式聚类算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
6 程尊平;周鼎;王晨;周皓峰;汪卫;施伯乐;;SDPHC——基于密度的分割和分层的自校聚类算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
7 张晓峰;王丽珍;陆叶;;一种基于属性加权的不确定K-means聚类算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
8 蔡军;袁华鹏;陈金海;施伯乐;;一种基于相似性分析的聚类新算法:PDS算法[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
9 胡仲义;郭超;王永炎;刘胜航;王宏安;;基于时间衰减和特征变量的数据流聚类算法[A];第29届中国数据库学术会议论文集(B辑)(NDBC2012)[C];2012年
中国博士学位论文全文数据库 前10条
1 胡雅婷;可能性聚类方法研究及应用[D];吉林大学;2012年
2 王纵虎;聚类分析优化关键技术研究[D];西安电子科技大学;2012年
3 周世兵;聚类分析中的最佳聚类数确定方法研究及应用[D];江南大学;2011年
4 杨燕;基于计算智能的聚类组合算法研究[D];西南交通大学;2006年
5 冯永;基于计算智能的聚类技术及其应用研究[D];重庆大学;2006年
6 刘晨;高伸缩性聚类分析方法研究[D];哈尔滨工程大学;2013年
7 王强;局部叠加基因表达模式聚类分析方法研究[D];哈尔滨工业大学;2012年
8 姜磊;混合演化聚类算法研究及其应用[D];武汉大学;2012年
9 尹学松;半监督聚类分析策略设计及其拓展性研究[D];南京航空航天大学;2009年
10 白亮;聚类学习的理论分析与高效算法研究[D];山西大学;2012年
中国硕士学位论文全文数据库 前10条
1 陈奇明;基于投票策略聚类融合算法的研究和实现[D];安徽工业大学;2010年
2 高f;基于密度聚类算法的改进方法研究[D];大连理工大学;2007年
3 吴书;类属型数据的聚类算法研究[D];厦门大学;2007年
4 谢信喜;符号聚类新方法的研究及应用[D];江南大学;2008年
5 黄海超;基于领域知识的半监督聚类算法研究[D];北京化工大学;2009年
6 朱国红;基于特征点选择的聚类算法研究与应用[D];山东大学;2010年
7 晏寒冰;结构聚类分析方法及应用研究[D];江南大学;2014年
8 张斌;基于模糊核聚类的基因芯片数据的研究[D];燕山大学;2010年
9 盛荣芬;聚类融合算法及其在移动渠道管理中的应用[D];中南大学;2011年
10 何X;基于聚类的用户特征分析[D];扬州大学;2008年
,本文编号:1138979
本文链接:https://www.wllwen.com/jingjilunwen/dianzishangwulunwen/1138979.html