基于用户特性的CF算法在B2C类电子商务RE中的研究与应用
本文关键词:基于用户特性的CF算法在B2C类电子商务RE中的研究与应用
更多相关文章: 推荐引擎 协同过滤 nosql 高并发 lucene
【摘要】:根据CNNIC一月份发布的《第29次中国互联网络发展状况统计报告》显示,截至2011年12月底,中国网民规模突破5亿,达到5.13亿,全年新增网民5580万。互联网普及率较上年底提升4个百分点,达到38.3%。分析显示电子商务类应用继续稳步发展,包括网络购物、网上支付、网上银行、旅行预订在内的电子商务类应用在2011年继续保持稳步发展态势,其中网络购物用户规模达到1.94亿人,较上年底增长20.8%,网上支付用户和网上银行全年用户也增长了21.6%和19.2%,目前用户规模分别为1.67亿和1.66亿。 目前IT系统的存储能力远远不足,就更不用说深入地挖掘和分析了。但要想使用这些数据并不是一件很容易的事情。本文将以推荐系统的设计为例提出一种综合的解决方案。在应对大数据和实时性要求的同时各大IT公司纷纷提出自己的解决之道,其中不乏优秀的系统和编程模式,如:google的hadoop技术框架,,nosql数据库和HDFS分布式存储技术,mapreduce编程模式,以及mahout等。本文就将依据这些新兴技术框架改造传统的推荐引擎使之可以满足大数据时代的实时性需求,提高推荐结果的命中率。 本文在提高推荐引擎(RE)的推荐精准度方面提出了,在传统的相似用户算法的基础之上进行改进的基于用户特性的相似用户计算的方法。从而充分考虑了用户自身的社会特性,提高的推荐数据个性化需求。并利用lucene平台进行具体的实现,在此基础之上还提出来推荐引擎的整体设计架构图。并对每部分拆分进行讲解。最后针对具体的实施过程当中出现的技术难点和关键点提出了两个切实可行的解决方案。分别是“基于redis+zookeeper的主从备份及单点故障自动切换技术”和“基于dubbo+lucene改进的索引数据自动分发技术”。
【关键词】:推荐引擎 协同过滤 nosql 高并发 lucene
【学位授予单位】:南华大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TP391.3
【目录】:
- 图表索引5-7
- 摘要7-8
- ABSTRACT8-10
- 术语及缩写语10-12
- 第一章 绪论12-18
- 1.1 项目背景与研究意义12-13
- 1.2 研究现状和发展目标13-15
- 1.3 本文的主要工作15-16
- 1.4 本文的组织结构16-18
- 第二章 推荐引擎18-24
- 2.1 推荐引擎的概念18-19
- 2.2 推荐引擎的分类19-20
- 2.3 推荐引擎的工作原理20-24
- 第三章 推荐算法24-32
- 3.1 集体智慧和协同过滤算法24-25
- 3.2 协同过滤算法计算步骤25-28
- 3.3 use-based 协同过滤算法28-29
- 3.4 item-based 协同过滤算法29-30
- 3.5 评分预测算法30-32
- 第四章 推荐系统升级设计方案及关键技术解决方案32-46
- 4.1 推荐引擎系统架构设计32-35
- 4.1.1 前台交互模块33-34
- 4.1.2 推荐产品34-35
- 4.1.3 数据运算模块、数据持久模块35
- 4.2 基于 redis+zookeeper 的主从备份及单点故障自动切换技术35-41
- 4.2.1 设计目标和原则36-37
- 4.2.2 系统总体架构37
- 4.2.3 开发环境以及技术支持37-38
- 4.2.4 系统组件及功能说明38-40
- 4.2.5 系统主要类图40
- 4.2.6 部署方案40-41
- 4.3 基于 dubbo+lucene 改进的索引数据自动分发技术41-46
- 4.3.0 设计目的与原则42-43
- 4.3.1 系统架构图43
- 4.3.2 开发环境以及技术支持43-44
- 4.3.3 系统组件及功能说明44
- 4.3.4 部署方案44-46
- 第五章 基于用户属性的协同过滤推荐算法及其实现46-60
- 5.1 数据的准备47-53
- 5.2 相似商品计算53-55
- 5.3 实时推荐部分55-57
- 5.3.1 推荐的产生55-56
- 5.3.2 强关联规则过滤56-57
- 5.5 实验结果分析57-60
- 5.5.1 系统运行效果图57
- 5.5.2 系统改进以后计算效率对比57-58
- 5.5.3 推荐精度对比58-60
- 第六章 总结60-62
- 参考文献62-66
- 成果目录66-67
- 致谢67
【参考文献】
中国期刊全文数据库 前10条
1 周军锋,汤显,郭景峰;一种优化的协同过滤推荐算法[J];计算机研究与发展;2004年10期
2 李聪;梁昌勇;马丽;;基于领域最近邻的协同过滤推荐算法[J];计算机研究与发展;2008年09期
3 田伟;彭玉青;;基于电子商务应用的协同过滤技术改进综述[J];计算机工程与科学;2008年10期
4 詹宇斌;殷建平;张玲;龙军;程杰仁;;一种基于有向树挖掘Web日志中最大频繁访问模式的方法[J];计算机应用;2006年07期
5 张付志;姜志英;;一种基于聚类技术的数字图书馆个性化推荐算法[J];计算机应用与软件;2008年07期
6 崔林;王辉;宋瀚涛;牛振东;陆玉昌;;基于网络内容和结构数据的用户浏览模型[J];河南科技大学学报(自然科学版);2005年06期
7 邓爱林,朱扬勇,施伯乐;基于项目评分预测的协同过滤推荐算法[J];软件学报;2003年09期
8 於志文,周兴社,谷建华,张勇;电视节目个性化技术的研究[J];小型微型计算机系统;2005年01期
9 霍华,冯博琴;基于压缩稀疏矩阵矢量相乘的文本相似度计算[J];小型微型计算机系统;2005年06期
10 张忠平;郭献丽;;PEV:一种新的用于Item-Based协同过滤算法的相似性度量方法[J];小型微型计算机系统;2009年04期
中国博士学位论文全文数据库 前2条
1 郭艳红;推荐系统的协同过滤算法与应用研究[D];大连理工大学;2008年
2 李聪;电子商务推荐系统中协同过滤瓶颈问题研究[D];合肥工业大学;2009年
本文编号:674712
本文链接:https://www.wllwen.com/jingjilunwen/dianzishangwulunwen/674712.html