移动互联网用户偏好特征分析系统的设计与实现
本文关键词:移动互联网用户偏好特征分析系统的设计与实现
更多相关文章: 移动互联网 用户偏好特征 Hadoop技术 K-Means聚类算法
【摘要】:近年来,随着移动互联网的迅猛发展、互联网技术的更新以及移动终端设备的广泛使用,手机和网络成了当代人最主要生活的方式。移动终端的使用,记录了移动互联网用户在网上操作时的各种偏好。对于这种偏好加以分析和利用,可以为企业带来新的生机和发展。另一方面,企业除了自身积极寻求创新发展以外,更需要根据用户的偏好特征做出战略决策,设计出更加符合用户偏好的产品,使其产品可以快速占领市场。甚至掌握了用户的偏好特征,就可以通过最恰当的渠道,对其进行精准营销。移动互联网用户偏好特征分析系统充分利用能直接体现出移动用户偏好特征的移动互联网上网日志数据进行分析和挖掘。使用分布式日志解析技术将用户互联网操作标签化,再利用聚类算法对用户进行特定主题的分群,最后通过统计分析展示出移动互联网用户的偏好特征。形成日志采集、日志解析、用户分群、偏好分析一体化的数据挖掘分析系统。论文首先描述了移动互联网用户偏好特征分析的概念及国内外的研究现状。剖析了核心业务流程,以此为基础从功能和性能两方面对系统进行了需求分析。然后从应用角度将系统划分为日志解析和统计子系统、用户偏好分析子系统和结果展现子系统。日志解析和统计子系统作为用户偏好分析的基础能力提供可用于分析的数据源。用户偏好分析子系统使用K-Means聚类算法,分析挖掘出用户的偏好特征。结果展现子系统则为系统用户展现偏好特征的分析结果。论文引入分层的体系结构风格,采用Hadoop分布式存储和计算框架,对系统中各个子系统和模块进行了详细的设计和实现,给出了功能设计、网络结构设计、体系结构设计、数据库设计和接口设计等内容。最后,为了验证系统的可用性,论文测试部分针对系统的功能和性能需求进行了详细测试。测试结果表明,本文完成的移动互联网用户偏好特征分析系统运行情况达到了预期的设计目标,并在某移动运营商上线使用,系统运行效果稳定可靠。
【关键词】:移动互联网 用户偏好特征 Hadoop技术 K-Means聚类算法
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.52
【目录】:
- 摘要4-5
- ABSTRACT5-9
- 第1章 绪论9-16
- 1.1 课题背景及来源9-10
- 1.2 国内外研究现状分析10-14
- 1.2.1 国内外发展现状10-12
- 1.2.2 用户偏好特征分析应用技术现状12-13
- 1.2.3 用户偏好特征分析未来发展趋势13-14
- 1.3 本文的研究内容和结构14-16
- 1.3.1 论文研究的内容14-15
- 1.3.2 论文的结构15-16
- 第2章 系统需求分析与相关技术介绍16-29
- 2.1 系统业务流程分析16-19
- 2.2 系统需求分析19-24
- 2.2.1 功能需求分析19-23
- 2.2.2 非功能需求分析23-24
- 2.3 相关应用技术介绍24-28
- 2.3.1 Hadoop技术介绍24-26
- 2.3.2 Mahout框架介绍26
- 2.3.3 K-Means聚类算法介绍26-28
- 2.4 本章小结28-29
- 第3章 系统设计与实现29-64
- 3.1 系统总体设计29-38
- 3.1.1 功能设计29-31
- 3.1.2 网络结构设计31-32
- 3.1.3 体系结构设计32-34
- 3.1.4 数据库设计34-36
- 3.1.5 接口设计36-38
- 3.2 日志解析和统计详细设计与实现38-46
- 3.2.1 日志采集配置管理设计与实现39-40
- 3.2.2 日志采集设计与实现40-42
- 3.2.3 日志解析配置管理设计与实现42-43
- 3.2.4 日志解析和统计设计与实现43-46
- 3.3 用户偏好特征分析详细设计与实现46-56
- 3.3.1 分群主题管理设计与实现46-47
- 3.3.2 用户分群设计与实现47-53
- 3.3.3 用户偏好统计设计与实现53-55
- 3.3.4 用户偏好特征结果分析设计与实现55-56
- 3.4 结果展现详细设计与实现56-63
- 3.4.1 日志解析结果查询设计与实现57-58
- 3.4.2 用户分群结果查询设计与实现58-60
- 3.4.3 用户偏好特征查询设计与实现60-61
- 3.4.4 用户视图查询设计与实现61-63
- 3.5 本章小结63-64
- 第4章 系统测试64-81
- 4.1 测试方案64-65
- 4.1.1 测试目的64
- 4.1.2 测试方法64
- 4.1.3 测试原则64-65
- 4.2 功能测试65-75
- 4.2.1 用户登录测试65
- 4.2.2 日志解析和统计子系统测试65-70
- 4.2.3 用户偏好特征分析子系统测试70-73
- 4.2.4 结果展现子系统测试73-75
- 4.3 性能测试75-80
- 4.3.1 系统访问最大并发数测试75-76
- 4.3.2 日志采集效率测试76-77
- 4.3.3 日志解析和统计效率测试77-78
- 4.3.4 用户分群效率测试78-79
- 4.3.5 结果展现查询响应速度测试79-80
- 4.3.6 日志采集接口测试80
- 4.4 本章小结80-81
- 结论81-82
- 参考文献82-86
- 致谢86-87
- 个人简历87
【相似文献】
中国期刊全文数据库 前10条
1 何文涛;莫武京;;会话Bean状态维护与实体Bean持久管理之比较[J];计算机应用与软件;2008年02期
2 朱爱梅;;浅析Java Bean的属性[J];科技经济市场;2007年07期
3 解萍;王伟;;通用查询会话Bean的设计[J];淮南师范学院学报;2009年03期
4 王博;陈莉君;;JAVA BEAN的分析和应用[J];西安文理学院学报(自然科学版);2008年01期
5 李中灵;;对JAVA BEAN的分析[J];硅谷;2010年03期
6 李春梅,邹平;GDSS中自治、协作Agent的研究[J];系统工程;2002年01期
7 贾小云,陈桦,奚宗悦;企业应用程序中会话Bean的设计[J];微电子学与计算机;2004年11期
8 欧阳迎春,欧阳春娟,夏洁武;基于Java Bean的科学计算系统的研究[J];电脑开发与应用;2005年12期
9 黄强;李敏;楼新远;;一个基于AOP的Bean锁算法[J];成都信息工程学院学报;2006年02期
10 郑先容;汤浪平;;J2EE中Session Bean的设计与开发[J];计算机时代;2007年04期
中国重要会议论文全文数据库 前1条
1 R.L.Conner;P.Balasubramanian;Soon Park;;Phenotypicand Genotypic Identification of Anthracnose Resistance for Kidney Bean Cultivars Grown in Western Canada[A];中国植物学会七十五周年年会论文摘要汇编(1933-2008)[C];2008年
中国重要报纸全文数据库 前5条
1 许国清;L.L.Bean让国人感受户外乐趣[N];消费日报;2008年
2 CBN记者 胡军华 田野;L. L. Bean:弃用百年经验重估中国市场[N];第一财经日报;2009年
3 记者 刘蛟;L.L.Bean中国首家旗舰店进驻北京[N];中国纺织报;2008年
4 李晓丽;户外用品里昂比恩正式进军中国市场[N];国际商报;2008年
5 赵纪;造鞋需要这么复杂吗?[N];中国经营报;2003年
中国硕士学位论文全文数据库 前10条
1 李晓宇;移动互联网用户偏好特征分析系统的设计与实现[D];哈尔滨工业大学;2016年
2 蔡少广;基于EJB的应用系统的分析与设计[D];西南交通大学;2005年
3 胡建华;实体Bean容器与容器管理持久化的研究与实现[D];中国科学院研究生院(软件研究所);2004年
4 张yN;基于EJB的电厂设备检修管理的研究与实现[D];华北电力大学(北京);2008年
5 程志达;基于EJB技术的电厂动态成本计算系统的研究与实现[D];华北电力大学(北京);2009年
6 冯泽涛;EJB技术规范及其在电子商务中的应用研究[D];山东科技大学;2005年
7 朱莹;新型组件EJB的研究与应用[D];东北财经大学;2005年
8 吴尚;Rose框架下的EJB开发及应用[D];武汉理工大学;2005年
9 刘建驰;一个教学水平评估系统的设计与实现[D];北京邮电大学;2010年
10 武刚;关于JDO技术规范及其应用研究[D];山东科技大学;2004年
,本文编号:596040
本文链接:https://www.wllwen.com/guanlilunwen/yingxiaoguanlilunwen/596040.html