互联网网站用户访问行为分析
发布时间:2017-04-04 10:09
本文关键词:互联网网站用户访问行为分析,由笔耕文化传播整理发布。
【摘要】:随着互联网的普及程度的变高,网络经济竞争日益激烈,用户对网站的服务质量要求越来越高,网络服务提供商的管理工作也逐渐从盲目走向科学,为此,网站用户行为分析研究显得越来越重要。通过用户行为分析,掌握用户访问网站的规律性特点,将挖掘出的用户访问模式应用于网站上,在发现顾客的兴趣和偏好,对顾客进行聚类、分类,为顾客提供个性化服务以及改善网站的建设等方面都有很重要意义。 识别用户的点击行为是分析用户网站访问行为的先决条件。而近年来,网络成为了广告炙手可热的载体。在用户访问网站过程中,浏览器会自动产生大量的网络广告请求,这对我们识别出用户点击行为造成了极大的干扰。因此,如何有效地去除这些广告干扰已经成为重要的研究课题。同时,网页浏览是网络用户最主要的网络行为,在准确识别用户点击行为的基础上,研究用户网站访问行为同样具有很重要的现实意义。 本文首先设计一个网站链接树分析软件,通过对10个主流领域中的100家媒体网站进行爬虫分析,发现了两种网络广告联盟结构:二层结构和三层结构。同时也对这10个领域网站的广告流量进行了分析,得到了网络广告在不同领域网站的分布现状。 其次,针对目前用户点击点识别率不高的问题,研究了一种访问树裁剪算法。根据访问树中用户点击节点、网络广告节点以及非用户点击的其他节点的特点,对访问树进行了逐步的裁剪,最终形成了用户点击访问树。 最后,以企业网用户作为分析对象,研究了企业网用户在不同类别网站上的访问树特点,分析了访问树的平均深度,主页平均访问次数等一系列访问树指标。同时,还得到了网站点击量排名等统计分析结果。
【关键词】:用户行为 网络广告 链接树 用户点击识别 访问树
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP393.092
【目录】:
- 摘要4-5
- ABSTRACT5-7
- 目录7-9
- 第一章 绪论9-13
- 1.1 研究背景9-10
- 1.2 论文研究的意义10-11
- 1.3 论文主要工作概述11-12
- 1.4 本章小结12-13
- 第二章 用户行为及关键技术13-23
- 2.1 互联网用户的概念与分类13-14
- 2.2 关键技术14-17
- 2.2.1 Web应用层协议14-16
- 2.2.2 网络报文捕获16-17
- 2.3 网络爬虫17-20
- 2.3.1 网络爬虫基本流程17-18
- 2.3.2 爬虫页面划分18-19
- 2.3.3 抓取策略19-20
- 2.4 数据挖掘20-21
- 2.5 本章小结21-23
- 第三章 企业网综合管理系统23-33
- 3.1 企业网管理系统架构23-26
- 3.1.1 企业网管理系统工作模式23-25
- 3.1.2 企业网管理软件系统架构25-26
- 3.2 企业综合管理系统的作用26-27
- 3.3 企业网综合管理系统主要模块27-32
- 3.3.1 管理界面27-28
- 3.3.2 网络业务识别模块28-29
- 3.3.3 网络流量统计模块29
- 3.3.4 网络业务排名模块29-30
- 3.3.5 用户行为数据存储30-32
- 3.4 本章小结32-33
- 第四章 基于WEB的在线广告网络的测量与评估33-45
- 4.1 网络广告联盟33-34
- 4.2 相关概念34-36
- 4.2.1 网络广告联盟分类34-35
- 4.2.2 网络广告联盟产业链35
- 4.2.3 广告匹配技术与检测效果35-36
- 4.3 网站爬虫分析软件设计36-38
- 4.3.1 链接树算法36-38
- 4.3.2 实验数据38
- 4.4 网络广告联盟投放广告机制分析38-42
- 4.4.1 二层结构38-39
- 4.4.2 三层结构39-40
- 4.4.3 网络广告联盟分布情况分析40-42
- 4.4.4 网络广告联盟分布情况分析42
- 4.5 网络广告流量分析42-44
- 4.5.1 基于链接树-哈希算法的广告流量分析42-43
- 4.5.2 广告流量分析结果43-44
- 4.6 本章小结44-45
- 第五章 网站用户点击识别研究45-51
- 5.1 用户点击行为45-46
- 5.1.1 研究现状45-46
- 5.1.2 用户点击行为46
- 5.2 用户点击点识别46-48
- 5.2.1 用户访问树裁剪算法47-48
- 5.3 算法验证与阈值选择48-50
- 5.3.1 数据集48-49
- 5.3.2 用户点击识别有效性49-50
- 5.4 本章小结50-51
- 第六章 用户网页浏览行为分析51-61
- 6.1 企业网用户网站访问行为分析系统51
- 6.2 企业网用户网站访问行为分析系统模块51-56
- 6.2.1 企业网用户网站访问行为需求分析51-52
- 6.2.2 数据采集52-53
- 6.2.3 数据预处理53-55
- 6.2.4 网站分类55
- 6.2.5 链接树算法55-56
- 6.3 分类网站结果分析56-57
- 6.3.1 数据规模56
- 6.3.2 平均访问深度56
- 6.3.3 主页平均访问次数56-57
- 6.3.4 访问树深度比例57
- 6.4 统计分析57-58
- 6.4.1 员工在线访问网页分布58
- 6.4.2 网站访问排名58
- 6.5 本章小结58-61
- 第七章 总结和展望61-63
- 参考文献63-65
- 致谢65-67
- 攻读学位期间发表的学术论文目录67
【参考文献】
中国期刊全文数据库 前4条
1 但小容;陈轩恕;刘飞;柳德伟;;数据挖掘中决策树分类算法的研究与改进[J];软件导刊;2009年02期
2 程光,龚俭,丁伟,徐加羚;面向IP流测量的哈希算法研究[J];软件学报;2005年05期
3 谢逸;余顺争;;基于Web用户浏览行为的统计异常检测[J];软件学报;2007年04期
4 赵金仿;赵艳;缪建明;;网页信息抽取及其自动文本分类的实现[J];计算机技术与发展;2008年10期
本文关键词:互联网网站用户访问行为分析,由笔耕文化传播整理发布。
,本文编号:285345
本文链接:https://www.wllwen.com/wenyilunwen/guanggaoshejilunwen/285345.html