基于电信DPI数据的电商用户行为分析
本文选题:DPI + Hadoop ; 参考:《北京邮电大学》2017年硕士论文
【摘要】:伴随着Internet的高速发展和Web技术的不断升级,人们的日常生活方式越来越多的搁置进Web中。随着而来的,是大数据时代的来临。大数据的来源是庞大的Web用户群体进行日常网络访问时产生的各式各样的行为,这些用户行为背后蕴藏着丰富的信息和潜在的价值,对企业运行经营方式产生了巨大影响。运营商通过DPI技术对网络流量进行采集分析,并对电商用户的行为进行分析挖掘,但海量的数据对传统的方法和模型提出了艰巨的挑战。利用并行计算和分布式存储技术,Hadoop平台为海量DPI数据的处理提供了解决方案。本文主要目标是利用DPI数据为基础数据,通过Wireshark工具分析用户访问电商的行为,提取电商用户行为的特征向量,结合利用爬虫程序采集的电商商品信息,在Hadoop平台实现构建用户画像MapReduce 的程序。本文的研究内容主要有以下几个方面:(1)给出了面向大数据的电商用户行为分析系统的整体设计方案。该系统主要有基础数据采集模块,DPI数据预处理模块以及用户行为分析模块组成。并给出了实现这三个模块的设计实现;(2)基于MapReduce思想的用户行为特征向量提取方法,根据用户地域特征,用户终端特征,访问不同网站的情况统计用户行为;(3)通过DPI和电商商品信息数据的聚合,实现了在Hadoop平台电商用户画像多种维度的构建;(4)根据电商用户画像,实现了基于ItemBased协同过滤的用户兴趣推荐模型。
[Abstract]:With the rapid development of Internet and the continuous upgrading of Web technology, more and more people's daily life style is put on the Web. What comes with it is the advent of the big data era. The source of big data is a variety of behaviors that occur when a large group of web users visit the network daily. Behind these user behaviors are abundant information and potential value, which has a great impact on the operation and management of enterprises. Operators collect and analyze network traffic through DPI technology, and analyze and mine the behavior of e-commerce users. However, the huge amount of data poses a formidable challenge to the traditional methods and models. Using the parallel computing and distributed storage technology Hadoop platform provides a solution for mass DPI data processing. The main goal of this paper is to use DPI data as the basic data, analyze the behavior of the user to access the electronic quotient by Wireshark tool, extract the characteristic vector of the user's behavior, and combine the information collected by the crawler program. In Hadoop platform to build a user portrait MapReduce program. The main contents of this paper are as follows: (1) the overall design scheme of big data oriented user behavior analysis system is presented. The system consists of basic data acquisition module, DPI data preprocessing module and user behavior analysis module. The design and implementation of the three modules are given. (2) the method of extracting user behavior feature vector based on MapReduce idea, according to the user regional characteristics, user terminal features, (3) through the aggregation of DPI and e-commerce commodity information data, we have realized the construction of various dimensions of e-commerce user portrait in Hadoop platform; (4) according to e-commerce user portrait, A user interest recommendation model based on Item-based collaborative filtering is implemented.
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP393.092;TP311.13
【相似文献】
相关期刊论文 前10条
1 徐卫;陈丽亚;刘功申;;基于用户行为分析的网站广告投放策略[J];计算机工程与应用;2006年28期
2 马维亮;;用户行为分析系统在宽带网络中的应用[J];科技信息(科学教研);2008年23期
3 乔志伟;;基于用户行为的3G业务分析与探讨[J];移动通信;2010年12期
4 龚尚福;姜晓旭;;基于用户行为分析的广告欺诈点击检测[J];计算机应用与软件;2011年04期
5 陶彩霞;谢晓军;陈康;郭利荣;刘春;;基于云计算的移动互联网大数据用户行为分析引擎设计[J];电信科学;2013年03期
6 毛承洁;张龙;庞川;陈洁敏;;社会网络服务及其用户行为分析[J];华南师范大学学报(自然科学版);2013年02期
7 雒江涛;胡燕清;徐孝娜;周进艳;;基于CDMA2000 1x EVDO网络的用户行为分析模型设计[J];电视技术;2013年07期
8 许春玲;范志刚;郑小盈;李明齐;;有线电视用户行为分析实践[J];网络新媒体技术;2014年01期
9 李朝阳;谢传中;;一种移动互联网用户行为分析系统的顶层设计[J];江西通信科技;2014年01期
10 刘英梅;;大数据时代的信息用户行为分析[J];科技情报开发与经济;2014年05期
相关会议论文 前9条
1 赵勇;;移动互联网用户行为分析系统技术架构浅析[A];2012全国无线及移动通信学术大会论文集(下)[C];2012年
2 冯铭;王保进;蔡建宇;;基于云计算的可重构移动互联网用户行为分析系统的设计[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
3 岑荣伟;刘奕群;张敏;茹立云;马少平;;网络搜索引擎用户行为分析和研究[A];第五届全国信息检索学术会议论文集[C];2009年
4 赵艳梅;朱晓燕;;转变运维模式,迎接移动互联网新挑战[A];中国通信学会信息通信网络技术委员会2011年年会论文集(上册)[C];2011年
5 刘奕群;张敏;马少平;;用户行为分析在网络信息检索中的应用概述[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
6 毛翔博;齐观德;李石坚;潘纲;;基于位置轨迹加权网络图的用户行为分析识别算法[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
7 尔古打机;苏小龙;朱征;;基于用户行为分析的移动终端偏好模型研究[A];第八届(2013)中国管理学年会——商务智能分会场论文集[C];2013年
8 董静梅;陈佩杰;;过度训练对大鼠中性粒细胞呼吸爆发及吞噬功能的影响及DPI的干预作用[A];第九届全国体育科学大会论文摘要汇编(4)[C];2011年
9 阮骊韬;王胜智;艾红;白筠菲;;DPI和超声造影在直肠结肠癌肝转移诊断中的价值[A];中国超声医学工程学会第八届全国腹部超声学术会议论文汇编[C];2010年
相关重要报纸文章 前4条
1 谭景华邋杨国良;IP网络用户行为分析方法的探讨[N];人民邮电;2007年
2 本报记者 逄丹;建设用户行为分析智慧模型[N];通信产业报;2010年
3 朱杰;DPI:打造智能服务网络[N];中国计算机报;2007年
4 本报记者 高赛;2400dpi能否挽救扫描仪行业[N];光明日报;2005年
相关博士学位论文 前6条
1 王琪;新媒体系统中用户行为分析与系统设计[D];复旦大学;2014年
2 罗海艳;移动用户网络行为分析与预测方法研究[D];沈阳农业大学;2015年
3 刘鹏;网络用户行为分析的若干问题研究[D];北京邮电大学;2010年
4 延皓;基于流量监测的网络用户行为分析[D];北京邮电大学;2011年
5 窦伊男;根据多维特征的网络用户分类研究[D];北京邮电大学;2010年
6 岑荣伟;基于用户行为分析的搜索引擎评价研究[D];清华大学;2010年
相关硕士学位论文 前10条
1 李子森;基于电信DPI数据的电商用户行为分析[D];北京邮电大学;2017年
2 江惠彬;基于Web日志的用户行为分析系统的研究与实现[D];华南理工大学;2015年
3 李亚飞;基于用户行为分析的冰箱设计研究[D];山东大学;2015年
4 石钊;基于网络用户行为分析的用户推荐反馈系统的设计[D];北京化工大学;2015年
5 李婷蔚;基于移动校园应用的用户行为分析及性能改进[D];电子科技大学;2014年
6 王颖颖;基于Hadoop的用户行为分析系统的设计与实现[D];北京工业大学;2015年
7 马仕玉;聚类算法及其在校园网用户行为分析中的应用[D];重庆交通大学;2015年
8 徐娟;基于用户行为分析的核能领域垂直检索系统研究[D];合肥工业大学;2015年
9 胡晓祥;基于飞天云平台的海量网络用户行为分析技术研究[D];南京大学;2014年
10 汪传章;基于博弈论的云用户行为分析预测模型研究与分析[D];东华理工大学;2016年
,本文编号:2061974
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2061974.html