当前位置:主页 > 管理论文 > 移动网络论文 >

基于计费系统的校园用户行为分析与建模

发布时间:2020-03-28 10:01
【摘要】:随着互联网络技术的飞速发展,特别是计算机技术的发展普及,人类社会的数据量呈现出爆炸式的增长趋势,如何充分发挥数据的价值,挖掘出海量数据中隐藏的有价值的知识与信息,已经成为当今互联网企业和高校的重点研究方向。在教育领域,计算机技术的普及也促进了高校信息化水平的提升,各类信息管理和网络系统在高校中得到广泛应用,并逐步累积了大量的学生网络行为数据,在此背景下,利用数据挖掘技术分析校园用户上网行为,不仅有助于校园用户更好地进行自我认知,而且还能够为网络管理者掌握校园网络使用情况和用户整体上网行为信息提供有效的技术支持。本文基于北京交通大学Dr.com计费系统的校园网络用户访问日志,从网页分类技术、用户行为分析建模、用户行为分析系统设计和实现三个方面展开了一系列的研究。具体研究内容如下:(1)研究了基于URL的网页分类技术。与传统的网页内容分类方法不同,本文提出了基于URL的网页混合分类算法,通过URL分类库和基于N-Gram语言模型的URL分类器两部分实现URL网页分类,最终通过WebKB数据集和URL分类库的验证了分类器的分类准确性。(2)研究了基于用户属性的用户行为建模技术。首先对计费日志进行数据预处理,包括数据清洗、用户识别、会话划分和基于网页相似性的会话归约;其次基于URL进行主题分类,并引入访问时长和访问频次因素,根据加权兴趣度获取用户兴趣主题表示;最后,结合用户的上网时间属性,建立了用户行为模型,并通过实验测试验证了模型的准确性。(3)设计并实现了校园用户行为分析系统。系统后端将用户行为模型的各个模块进行实现;系统前端分为校园用户端和校园管理员端,校园用户端可以查看自己的历史访问记录以及上网行为的分析结果;校园管理员端可以查看全校用户的整体访问行为,并可以进行异常行为的检测。
【图文】:

过程图,过程,数据挖掘,数据


数据挖掘就是“数据—知识”。现在很多人将数据库中的知识发现逡逑(Knowledge邋Discovery邋in邋Database,邋KDD)看作数据挖掘一个流行的同义词。KDD逡逑从输入数据到输出挖掘知识的过程如图1-1所示。逡逑清理和集成逡逑 …逦i逡逑数据库邋\逦逦it逡逑选择和变换处理后的数据逡逑数据仓库逡逑数据挖掘逡逑一般文件逦I逡逑知识逦模型逡逑图1-1邋KDD过程逡逑Fig邋1-1邋Process邋of邋KDD逡逑目前在信息产业界一般是将数据清理和数据集成作为数据预处理步骤执行,逡逑结果数据存放在数据仓库中。数据挖掘步骤可与用户或知识库交互,将有趣的模式逡逑提供给用户,或作为新的知识存放在知识库中。逡逑Web日志挖掘就是对Web数据进行数据挖掘与分析,从杂乱无序的数据中发逡逑现潜藏的价值和知识模式。Web信息复杂多变,结构化、半结构化甚至是非结构化逡逑的数据在Web上随处可见,Web挖掘可以把多种数据作为处理对象,可以是服务逡逑器日志、浏览器Cookie、用户的网上购物信息或者用户使用应用软件的行为习惯。逡逑3逡逑

基于计费系统的校园用户行为分析与建模


图1-2邋Web挖掘的分类逡逑Fi1-2邋Web邋MininClassification逡逑
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP393.09

【参考文献】

相关期刊论文 前10条

1 米允龙;米春桥;刘文奇;;海量数据挖掘过程相关技术研究进展[J];计算机科学与探索;2015年06期

2 王家鑫;;基于数据挖掘的校园网用户网络行为分析[J];数字技术与应用;2014年11期

3 陈锋;;基于校园一卡通系统的高校用户就餐消费行为分析与数据挖掘[J];中国教育信息化;2014年09期

4 许国迎;张宁;;基于网页浏览的用户兴趣度研究[J];上海理工大学学报;2013年05期

5 李德新;;基于数据挖掘的网络日志分析[J];电脑知识与技术;2011年25期

6 郑晓健;庞淑英;何英;;一种面向主题的用户兴趣挖掘模型研究[J];昆明学院学报;2010年03期

7 孙宇航;孙应飞;;基于网络日志的数据挖掘预处理改进方法[J];系统工程与电子技术;2009年12期

8 郭岩,白硕,杨志峰,张凯;网络日志规模分析和用户兴趣挖掘[J];计算机学报;2005年09期

9 陈新中,李岩,谢永红,杨炳儒;Web挖掘研究[J];计算机工程与应用;2002年13期

10 吴强;梁继民;杨万海;;Web日志挖掘预处理中的用户识别技术[J];计算机科学;2002年04期

相关硕士学位论文 前10条

1 陈炜;基于大数据技术的用户行为分析系统的研究[D];西安科技大学;2018年

2 程元X;基于URL+文本的网页主题分类模型研究[D];武汉邮电科学研究院;2018年

3 周雪;基于网络日志的用户行为分析与研究[D];北京邮电大学;2017年

4 黎斌;面向URL的用户建模关键技术研究[D];哈尔滨工业大学;2016年

5 杨镒铭;基于URL模式的网页分类算法研究[D];中国科学技术大学;2016年

6 杨志忠;基于Hadoop的网络用户行为分析[D];兰州理工大学;2016年

7 许昌达;网络用户行为的多维度分析方法[D];北京理工大学;2015年

8 马仕玉;聚类算法及其在校园网用户行为分析中的应用[D];重庆交通大学;2015年

9 尧婷娟;校园无线局域网用户行为分析研究[D];山东大学;2014年

10 李游;基于校园网的用户行为分析研究[D];云南大学;2013年



本文编号:2604295

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2604295.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9791e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com