基于改进K-means聚类的推荐方法研究
发布时间:2019-09-28 07:05
【摘要】:互联网和电子商务的发展,产生了大量的数据,从而导致网络资源的信息过载。当搜索引擎技术已经无法解决信息过载问题时,推荐系统应运而生。常见的推荐系统有:协同过滤推荐、基于内容的推荐和基于图的推荐,但它们都存在数据稀疏和计算量大的问题,使得推荐结果不准确和实时性差。针对这些问题进行深入研究,主要工作和贡献如下:首先,针对传统K-means算法随机选择初始聚类中心,极易造成聚类结果不准确的问题,提出了一种基于最小方差和最大化最小距离的思想改进K-means算法初始聚类中心的选择方法。接着提出了一种基于用户信任关系和评分偏好的新方法度量用户之间的相似度,从而在一定程度上解决了推荐系统在计算用户相似度时面临的数据稀疏问题。其次,提出了一种改进K-means聚类的推荐方法IKC(Improved K-means Clustering Recommendation Method)。利用基于信任关系的用户相似度代替K-means算法中对象之间的欧式距离;接着用改进的K-means算法对用户进行聚类划分,把相似度较高的用户聚集到同一个子类中,然后用Top-N算法生成推荐列表。在MovieLens(1M)和Epinions数据集上的实验表明:基于IKC算法的推荐方法在相同数据集下不同数据稀疏度的平均绝对误差和均分根误差两项指标都较其他四种比较算法小,解决了数据稀疏问题;且IKC算法在相同的数据集上的执行效率也较其他四种比较算法高,解决了计算量大的问题。所以IKC算法在推荐系统的准确性和实时性方面都有很大的提高。
【学位授予单位】:华中科技大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.3
本文编号:2543180
【学位授予单位】:华中科技大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.3
【参考文献】
相关期刊论文 前6条
1 邓海;覃华;孙欣;;一种优化初始中心的K-means聚类算法[J];计算机技术与发展;2013年11期
2 Feng Xie;Zhen Chen;Hongfeng Xu;Xiwei Feng;Qi Hou;;TST: Threshold Based Similarity Transitivity Method in Collaborative Filtering with Cloud Computing[J];Tsinghua Science and Technology;2013年03期
3 张靖;段富;;优化初始聚类中心的改进k-means算法[J];计算机工程与设计;2013年05期
4 贾冬艳;张付志;;基于双重邻居选取策略的协同过滤推荐算法[J];计算机研究与发展;2013年05期
5 罗敏,王丽娜,张焕国;基于无监督聚类的入侵检测方法[J];电子学报;2003年11期
6 陈铁梅,黄道平,陆顾新,朱学锋;模式聚类在数据预处理中的应用研究[J];计算机与应用化学;2003年03期
相关硕士学位论文 前2条
1 刘坤朋;数据挖掘中聚类算法的研究[D];长沙理工大学;2010年
2 周涓;基于最大最小距离法的多中心聚类算法研究[D];重庆大学;2006年
,本文编号:2543180
本文链接:https://www.wllwen.com/jingjilunwen/dianzishangwulunwen/2543180.html