基于用户数据挖掘的博库图书商城推荐方法研究
本文选题:博库图书商城 切入点:用户数据挖掘 出处:《哈尔滨理工大学》2017年硕士论文 论文类型:学位论文
【摘要】:随着电子商务领域数据量的迅速增长,电子商务已进入以数据为基础的时代,电商都希望抓住这一契机,将数据有效利用,个性化推荐已成为电商数据应用的重要切入点,其作用就是为用户提供高质量的个性化推荐服务。通过收集大量用户数据并挖掘隐含的用户偏好,向用户推荐个性化商品,刺激用户的购物欲望,从而提高销售额,获得更大的利润。除此之外,个性化推荐还能挖掘出用户潜在的购物意向,向客户推荐到目前为止未接触过但以后可能购买的商品信息。不仅能为用户带来优质的服务,还能为电商企业带来前所未有的利润,这也是个性化推荐广泛应用的原因之一。因此,电子商务企业的个性化推荐不仅可以提高企业的服务质量,还可以促进用户购买。本文以博库图书商城为研究对象,分析商城产生数据的类型,特点及用户数据应用中存在的问题,进而分析商城数据挖掘过程及推荐方法,将用户数据分为文本评论数据,基本特征数据,交易行为数据。在评论的数据挖掘中,将虚假评论过滤,基于情感词提取图书属性,构建图书属性库,将用户—图书评分转化为用户—属性评分;在用户基本特征和交易行为特征的挖掘中,挖掘衍生属性,利用FCM聚类方法将用户分为高价值用户,中等价值用户,普通价值用户,低价值用户,在四个类内利用改进的用户相似性方法计算用户相似性,利用用户相似性填充用户—属性评分稀疏矩阵;基于填充后的矩阵得出目标用户偏好的最近邻居集,计算用户对未评属性的评分,将目标用户对商品的所有属性评分均值进行排序,形成该用户的Top-N推荐列表。完成推荐,通过实验证明推荐方法设计的准确性。通过对博库图书商城的用户数据挖掘及推荐方法的设计,一方面充分利用了商城产生的用户数据,结合协同过滤推荐理论,丰富数据挖掘理论及其应用;另一方面通过为博库图书商城设计个性化推荐方法,达到精准化地向用户推荐图书的目的,对网上图书类商城的经营提供帮助。
[Abstract]:With the rapid growth of data volume in the field of electronic commerce, electronic commerce has entered a data-based era. E-commerce hopes to seize this opportunity, make effective use of data, and personalized recommendation has become an important entry point for the application of e-commerce data. Its function is to provide high quality personalized recommendation service for users. By collecting a large amount of user data and mining hidden user preferences to recommend personalized products to users, stimulate the user's desire to buy, thereby increasing the sales volume. Besides, personalized recommendation can also discover the potential shopping intention of the user, and recommend to the customer information that has not been contacted so far but may be purchased in the future. It can not only bring good service to the user, It can also bring unprecedented profits to e-commerce enterprises, which is one of the reasons why personalized recommendation is widely used. Therefore, the personalized recommendation of e-commerce enterprises can not only improve the service quality of enterprises, This paper analyzes the types and characteristics of the data generated by the mall and the problems existing in the application of user data, and then analyzes the process of data mining and the recommended method of the shopping mall. The user data is divided into text comment data, basic characteristic data and transaction behavior data. In the data mining of comments, the false comments are filtered, the book attributes are extracted based on emotional words, and the library of book attributes is constructed. The user-book score is transformed into the user-attribute score, and in the mining of the user's basic characteristics and transaction behavior characteristics, the derived attributes are mined, and the users are divided into high value users, middle value users and ordinary value users by using FCM clustering method. In the four classes, the improved user similarity method is used to calculate the user similarity, the user similarity is used to fill the user-attribute score sparse matrix, and the nearest neighbor set of the target user preference is obtained based on the filled matrix. Calculate the user's rating of the unevaluated attributes, rank the target user's average value of all the attributes of the item, form the user's Top-N recommendation list, and complete the recommendation. Through experiments, the accuracy of the design of recommendation method is proved. Through the design of user data mining and recommendation method of Boku Book Market, on the one hand, it makes full use of the user data generated by the mall, and combines with the theory of collaborative filtering recommendation. On the other hand, by designing the personalized recommendation method for the book mall of Boku, we can accurately recommend the books to the users, and provide help for the management of the online book mall.
【学位授予单位】:哈尔滨理工大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:G239.23;F724.6;F274
【相似文献】
相关期刊论文 前10条
1 香丽芸;浅谈数据挖掘及其应用[J];昌吉师专学报;2001年02期
2 郑雪燕,张杰明,岳洋;数据挖掘语言[J];计算机时代;2001年11期
3 刘明晶;数据挖掘[J];华南金融电脑;2001年04期
4 张伟;刘勇国;彭军;廖晓峰;吴中福;;数据挖掘发展研究[J];计算机科学;2001年07期
5 钟晓;马少平;张钹;俞瑞钊;;数据挖掘综述[J];模式识别与人工智能;2001年01期
6 朱建平,张润楚;数据挖掘的发展及其特点[J];统计与决策;2002年07期
7 傅岚;在数据海洋中打捞信息数据挖掘[J];科技广场;2002年11期
8 李峻;数据挖掘,企业洞察先机的“慧眼”[J];中国计算机用户;2002年48期
9 罗可,蔡碧野,卜胜贤,谢中科;数据挖掘及其发展研究[J];计算机工程与应用;2002年14期
10 ;2002数据挖掘研讨班[J];计算机工程;2002年06期
相关会议论文 前10条
1 史东辉;蔡庆生;张春阳;;一种新的数据挖掘多策略方法研究[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
2 张弦;;数据挖掘在农业中的应用[A];纪念中国农业工程学会成立30周年暨中国农业工程学会2009年学术年会(CSAE 2009)论文集[C];2009年
3 魏顺平;;教育数据挖掘:现状与趋势[A];信息化、工业化融合与服务创新——第十三届计算机模拟与信息技术学术会议论文集[C];2011年
4 关清平;沉培辉;;概率网络在数据挖掘上的应用[A];科技、工程与经济社会协调发展——中国科协第五届青年学术年会论文集[C];2004年
5 丁瑾;;基于Web数据挖掘的综述[A];山西省科学技术情报学会学术年会论文集[C];2004年
6 聂茹;田森平;;Web数据挖掘及其在电子商务中的应用[A];中南六省(区)自动化学会第24届学术年会会议论文集[C];2006年
7 李菊;王军;;数据挖掘在客户关系管理的应用[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
8 肖阳;李启贤;;数据挖掘在中国钢铁行业中的应用[A];中国计量协会冶金分会2012年会暨能源计量与节能降耗经验交流会论文集[C];2012年
9 杨磊;王贵成;汪勇;张占胜;;SQL Server 2005在数据挖掘中的应用[A];2009年中国智能自动化会议论文集(第二分册)[C];2009年
10 谢中;邱玉辉;;面向商务网站有效性的数据挖掘方法[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
相关重要报纸文章 前10条
1 本报记者褚宁;数据挖掘如“挖金”[N];解放日报;2002年
2 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
3 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
4 《网络世界》记者 王莹;数据挖掘保险业的新蓝海[N];网络世界;2012年
5 刘俊丽;基于地理化的网络数据挖掘与分析提升投资有效性[N];人民邮电;2014年
6 本报记者 连晓东;数据挖掘:金融信息化新热点[N];中国电子报;2002年
7 本报记者 凤小华 朱仁康;“数字挖掘软件”引领中国信息化新浪潮[N];中国电子报;2003年
8 本报记者 史延廷;“成功企业数据挖掘暨数量化管理论坛”在京举办[N];中国旅游报;2002年
9 朱小宁;数据挖掘:信息化战争的基础工程[N];解放军报;2005年
10 本报记者 王小平;从“大集中”走向数据挖掘[N];金融时报;2002年
相关博士学位论文 前10条
1 于自强;海量流数据挖掘相关问题研究[D];山东大学;2015年
2 张馨;全基因组SNP芯片应用于CNV和L0H分析的软件比对与数据挖掘[D];复旦大学;2011年
3 彭计红;基于数据挖掘的痴呆中医证的研究[D];南京中医药大学;2015年
4 李秋虹;基于MapReduce的大规模数据挖掘技术研究[D];复旦大学;2013年
5 邬文帅;基于多目标决策的数据挖掘方法评估与应用[D];电子科技大学;2015年
6 谢邦彦;整合数据挖掘与TRIZ理论的质量管理方法研究[D];首都经济贸易大学;2010年
7 何伟全;云南高校学生意外伤害因素关联规则挖掘及风险管控体系研究[D];昆明理工大学;2015年
8 段功豪;基于多结构数据挖掘的滑坡灾害预测模型研究[D];中国地质大学;2016年
9 白晓明;基于数据挖掘的复合材料宏—细观力学模型研究[D];哈尔滨工业大学;2016年
10 蓝永豪(LAM Wing Ho);基于数据挖掘技术分析当代中医名家痤疮验方经验研究[D];南京中医药大学;2016年
相关硕士学位论文 前10条
1 林仁红;基于数据挖掘的机遇识别与评价研究[D];首都经济贸易大学;2007年
2 张彦俊;游戏运营中的数据挖掘[D];复旦大学;2011年
3 焦亚召;基于多核函数FCM算法在数据挖掘聚类中的应用研究[D];昆明理工大学;2015年
4 王杰锋;物联网能耗数据智能分析及其应用平台设计[D];江南大学;2015年
5 刘学建;数据挖掘在电子商务推荐系统中的应用研究[D];昆明理工大学;2015年
6 戴阳阳;基于数据挖掘的金融时间序列预测研究与应用[D];江南大学;2015年
7 石思优;基于主题模型的医疗数据挖掘研究[D];广东技术师范学院;2015年
8 陈丹;移动互联网信令挖掘实现智慧营销的设计与实现应用研究[D];华南理工大学;2015年
9 陈思;基于数据挖掘的大学生客户识别模型的研究[D];昆明理工大学;2015年
10 位长帅;基于客户数据挖掘的电信客户关系管理研究[D];西南交通大学;2015年
,本文编号:1583673
本文链接:https://www.wllwen.com/jingjilunwen/xmjj/1583673.html