用户网络行为分析系统的设计与实现
发布时间:2017-07-14 22:39
本文关键词:用户网络行为分析系统的设计与实现
更多相关文章: 网络用户行为分析 web挖掘 web日志挖掘 Pentaho BI
【摘要】:互联网的飞速发展,用户数量的迅速增长,企业信息化建设的逐步深入,使得用户信息呈爆炸式的增长。而目前很多企业对用户数据仅仅停留在简单的查找,缺乏深层次的信息挖掘和分析。本文通过对企业在客户关系管理系统中积累下来的大量数据进行分析,实现了网络用户的用户行为分析系统。 本论文是一篇工程性论文,来源于国内知名航运服务公司。利用基于Pentaho BI的商务智能分析平台,从客户关系管理系统中获取数据源,实现用户信息的分析和管理。为企业的决策提供科学合理的支持。概括来说本论文实现了以下四方面内容: (1)从数据挖掘的角度,通过web服务器日志、Web网络爬虫技术获取用户网络行为数据。进而对用户网络行为原始数据过滤、分析和,形成用户数据源,利用数据挖掘知识对数据源进行挖掘。 (2)本项目的总体流程参照软件工程的思想,首先对用户网络行为系统进行需求分析和总体设计,之后对每个模块进行详细设计。 (3)本项目运用了多项计算机技术,包括Linux脚本,MySQL数据库存储过程、Java的并发编程等,实现对用户行为数据的自动化采集与整合。 (4)应用商务智能(BI)套件,对数据进行多维分析、建模。并利用Report Designer组件制作报表,对数据分析结果进行直观的展不。 通过以上工作,实现了基于Web日志挖掘的用户网络行为分析系统,为企业决策者提供智能的、全面的、多角度的用户分析支持。
【关键词】:网络用户行为分析 web挖掘 web日志挖掘 Pentaho BI
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP393.09
【目录】:
- 摘要4-5
- ABSTRACT5-8
- 第一章 绪论8-13
- 1.1 研究背景和意义8-9
- 1.2 研究现状9-10
- 1.3 硕士期间相关工作10-11
- 1.4 论文的研究内容和主要工作11
- 1.5 论文结构综述11-13
- 第二章 相关理论基础和关键技术13-24
- 2.1 用户网络行为13-15
- 2.1.1 用户网络行为定义13-14
- 2.1.2 用户网络行为特征14
- 2.1.3 用户网络行为分类14-15
- 2.2 Web挖掘技术15-17
- 2.2.1 Web挖掘的原理15
- 2.2.2 Web挖掘的分类15-16
- 2.2.3 Web日志挖掘16-17
- 2.3 商务智能软件17-23
- 2.3.1 开源商务智能软件的优势分析18-19
- 2.3.2 Pentaho平台集成化分析19-21
- 2.3.3 Pentaho技术架构分析21-23
- 2.4 本章小结23-24
- 第三章 系统总体设计24-36
- 3.1 系统需求内容24-28
- 3.1.1 运营情况分析24-25
- 3.1.2 用户基本信息分析25-26
- 3.1.3 用户访问信息分析26
- 3.1.4 用户网络行为维度分析26-27
- 3.1.5 系统需求总结27-28
- 3.2 系统架构设计28-31
- 3.2.1 系统应用分层28-30
- 3.2.2 系统架构设计30-31
- 3.3 系统环境准备31-35
- 3.4 本章小结35-36
- 第四章 系统模块设计36-49
- 4.1 数据获取模块设计36-39
- 4.1.1 数据获取过程36-38
- 4.1.2 日志规范化处理38-39
- 4.2 数据预处理模块设计39-43
- 4.2.1 数据清理39-40
- 4.2.2 用户识别40-42
- 4.2.3 会话识别42-43
- 4.3 数据存储模块设计43-48
- 4.3.1 数据表关系43-44
- 4.3.2 表结构详情44-46
- 4.3.3 维度表表结构46-48
- 4.4 本章小结48-49
- 第五章 用户网络行为分析系统实现49-64
- 5.1 系统多维建模实现49-55
- 5.1.1 用户网络行为分析系统的多维模型构建49-53
- 5.1.2 用户行为分析系统多维建模53-55
- 5.2 报表的实现55-59
- 5.2.1 报表架构55-56
- 5.2.2 报表实现流程56-59
- 5.3 报表结果分析59-63
- 5.3.1 每日注册量分析59-61
- 5.3.2 每周注册量趋势分析61
- 5.3.3 用户每月注册趋势分析61-63
- 5.3.4 注册用户地域分布63
- 5.4 本章小结63-64
- 第六章 论文总结与展望64-66
- 6.1 论文总结64
- 6.2 下一步展望64-66
- 参考文献66-68
- 致谢68-69
- 攻读硕士学位期间学术论文发表情况69
【参考文献】
中国期刊全文数据库 前10条
1 宋爱波,胡孔法,董逸生;Web日志挖掘[J];东南大学学报(自然科学版);2002年01期
2 李甲林;;Web数据挖掘技术研究综述[J];电脑知识与技术;2009年36期
3 欧阳秀平;王攀;饶翔;;基于业务智能感知和行为分析引擎的用户行为分析模型[J];电信快报;2008年10期
4 姜良华;陈超泉;;Web日志统计分析系统的设计与实现[J];福建电脑;2008年11期
5 宋擒豹,沈钧毅;Web日志的高效多能挖掘算法[J];计算机研究与发展;2001年03期
6 宁红云;刘金兰;;基于WEB挖掘的企业营运能力绩效评价模型的研究[J];计算机应用与软件;2007年10期
7 蔡猷花;张岐山;;Web使用模式挖掘及其在电子商务领域的应用[J];科技管理研究;2005年11期
8 宁建飞;;一种基于Web日志的Web用户群体和URL聚类算法[J];海南大学学报(自然科学版);2012年04期
9 张传立;;基于Linux的日志分析[J];科技信息;2011年13期
10 陈荣鑫;付永钢;陈维斌;;基于Pentaho的商业智能系统[J];计算机工程与设计;2008年09期
,本文编号:542544
本文链接:https://www.wllwen.com/guanlilunwen/kehuguanxiguanli/542544.html