当前位置:主页 > 科技论文 > 软件论文 >

基于Hadoop的电子商务个性化推荐研究与实现

发布时间:2018-05-24 03:49

  本文选题:云计算 + 电子商务 ; 参考:《兰州交通大学》2017年硕士论文


【摘要】:随着互联网的迅猛发展,人类社会进入了云计算时代,云计算时代个性化和差异化已经成为企业的核心竞争力,电子商务的兴起实现了从“以产品为中心”向“以客户为中心”的消费模式的转变,极大地提高了用户和企业之间的交易效率。然而电子商务在为用户提供快捷便利的服务时,用户和商品数量正以指数级别递增,由此引发信息超载和信息迷航,为使用户在互联网中能更便捷地获取所需信息,电子商务个性化推荐系统由此产生,它根据用户的兴趣偏好及购物习惯向其推荐感兴趣的商品。电子商务网站使用个性化推荐系统分析用户的兴趣偏好,帮助用户从庞大的商品目录中挑选真正适合自己需要的商品,为每个用户提供个性化服务,在很多电子商务个性化推荐技术中,作为当今运用最广泛、最成功的推荐策略,协同过滤推荐算法对电子商务个性化推荐系统性能的优劣至关重要。但是传统的协同过滤推荐算法存在稀疏性高、可扩展性和实时性差等问题,导致电子商务个性化推荐系统无法为用户提供高效的推荐服务。因此,针对协同过滤推荐算法中存在的稀疏性、可扩展性和实时性等问题,本文设计了一种基于Hadoop的电子商务个性化推荐算法,利用Hadoop云计算平台所拥有的强大计算及存储能力对基于项目的协同过滤推荐算法予以改进。首先根据用户的评分使用Canopy算法进行聚类预处理,将项目集合中的全部项目迅速划分到不同的Canopy中并生成相应的聚类中心。接着按照Canopy聚类中心集合使用FCM算法对项目集合中的每个项目迭代求出其相对于各个聚类的隶属度和聚类中心,并根据最大隶属度原则确定每个项目所属的聚类,从而得到最终的聚类集合。然后在Canopy-FCM聚类模型上根据目标项目与所有聚类中心之间的相似度,选择相似度最高的前若干个聚类中的项目构建目标项目的推荐候选项目空间。最后在推荐候选项目空间上使用IBCF算法在线完成推荐。在MovieLens数据集上与一些传统的协同过滤算法进行的分析和对比的实验结果表明,该算法在分布式集群上具有较好的可扩展性和推荐效率,并且推荐精度也有所提高,可以较好地改进电子商务个性化推荐中存在的稀疏性、可扩展性和实时性问题。
[Abstract]:With the rapid development of the Internet, the human society has entered the cloud computing era, the cloud computing era of individuation and differentiation has become the core competitiveness of enterprises, The rise of electronic commerce has realized the transformation from "product-centered" to "customer-centered" consumption mode, and greatly improved the transaction efficiency between users and enterprises. However, when electronic commerce provides users with fast and convenient services, the number of users and commodities is increasing exponentially, which leads to information overload and information confusion, so that users can obtain the information they need more easily on the Internet. E-commerce personalized recommendation system comes into being, according to the user's interest preference and shopping habits to recommend the interested goods to them. E-commerce websites use personalized recommendation system to analyze the interests of users, help users choose from the huge catalog of products that are really suitable for their own needs, and provide personalized services for each user. In many e-commerce personalized recommendation technology, as the most widely used and most successful recommendation strategy, collaborative filtering recommendation algorithm is very important to the performance of e-commerce personalized recommendation system. However, the traditional collaborative filtering recommendation algorithm has many problems, such as high sparsity, poor scalability and real-time performance, which leads to the lack of efficient recommendation service for users in E-commerce personalized recommendation system. Therefore, aiming at the problems of sparsity, extensibility and real-time in collaborative filtering recommendation algorithm, a personalized recommendation algorithm for e-commerce based on Hadoop is designed in this paper. Based on the powerful computing and storage capability of Hadoop cloud computing platform, the project based collaborative filtering recommendation algorithm is improved. Firstly, the Canopy algorithm is used to preprocess the clustering according to the user's score. All the items in the item set are quickly divided into different Canopy and the corresponding clustering centers are generated. Then, according to the Canopy clustering center set, each item in the item set is iterated by FCM algorithm to find out its membership degree and cluster center relative to each cluster, and according to the principle of maximum membership degree, each item belongs to the cluster. Finally, the final clustering set is obtained. Then, according to the similarity between the target items and all the clustering centers on the Canopy-FCM clustering model, the items in the first few clusters with the highest similarity are selected to construct the recommended candidate space of the target items. Finally, the IBCF algorithm is used to complete the recommendation online in the recommended candidate space. The results of analysis and comparison with some traditional collaborative filtering algorithms on MovieLens dataset show that the proposed algorithm has better scalability and recommendation efficiency in distributed clusters, and the recommendation accuracy is also improved. It can improve the sparse, extensibility and real-time problems in e-commerce personalized recommendation.
【学位授予单位】:兰州交通大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.3

【参考文献】

相关期刊论文 前10条

1 田保军;胡培培;杜晓娟;苏依拉;;Hadoop下基于聚类协同过滤推荐算法优化的研究[J];计算机工程与科学;2016年08期

2 时念云;葛晓伟;马力;;基于用户人口统计特征与信任机制的协同推荐[J];计算机工程;2016年06期

3 周明建;赵建波;李腾;;基于情境相似的知识个性化推荐系统研究[J];计算机工程与科学;2016年03期

4 张红军;;基于用户要求的互联网产品差异化设计探究[J];产业与科技论坛;2015年22期

5 冯利光;刘其成;;基于FCM并行算法的微博热点发现[J];计算机应用与软件;2015年11期

6 郑孝遥;鲍煜;孙忠宝;罗永龙;;一种基于信任的协同过滤推荐模型[J];计算机工程与应用;2016年05期

7 陈平华;陈传瑜;;基于满二叉树的二分K-means聚类并行推荐算法[J];计算机工程与科学;2015年08期

8 杜江;张铮;张杰鑫;邰铭;;MapReduce并行编程模型研究综述[J];计算机科学;2015年S1期

9 朱夏;宋爱波;东方;罗军舟;;云计算环境下基于协同过滤的个性化推荐机制[J];计算机研究与发展;2014年10期

10 王永贵;李鸿绪;宋晓;;MapReduce模型下的模糊C均值算法研究[J];计算机工程;2014年10期

相关博士学位论文 前7条

1 刘龙;一个能实现个性化实时路径推荐服务的推荐系统框架[D];中国科学技术大学;2014年

2 孔维梁;协同过滤推荐系统关键问题研究[D];华中师范大学;2013年

3 吴和生;云计算环境中多核多进程负载均衡技术的研究与应用[D];南京大学;2013年

4 孙慧峰;基于协同过滤的个性化Web推荐[D];北京邮电大学;2012年

5 薛福亮;电子商务协同过滤推荐质量影响因素及其改进机制研究[D];天津大学;2012年

6 邓晓懿;移动电子商务个性化服务推荐方法研究[D];大连理工大学;2012年

7 夏培勇;个性化推荐技术中的协同过滤算法研究[D];中国海洋大学;2011年

相关硕士学位论文 前9条

1 赵伟;基于Hadoop的数据挖掘算法并行化研究[D];西南交通大学;2015年

2 黎安能;基于Hadoop的改进聚类协同过滤推荐算法研究[D];重庆大学;2015年

3 况亚萍;云计算技术在协同过滤推荐中的应用研究[D];中国科学技术大学;2014年

4 袁利;基于聚类的协同过滤个性化推荐算法研究[D];华中师范大学;2014年

5 李小龙;基于MapReduce的电子商务个性化推荐研究[D];北京交通大学;2014年

6 韩飞飞;基于云计算的电子商务个性化推荐研究[D];华北电力大学;2014年

7 熊宇;协同过滤的电子商务个性化服务推荐系统的研究[D];电子科技大学;2013年

8 Korir Sammy(克瑞);云计算数据中心中节能安全的虚拟机实时迁移研究[D];中南大学;2012年

9 刘浩;基于负载均衡的存储架构研究与应用[D];山东大学;2011年



本文编号:1927572

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1927572.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户da881***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com