基于改进iForest的学生异常行为检测及分析系统研究
发布时间:2021-11-27 02:07
随着社会的高速发展,人们的生活节奏也日益加快,而高速的生活节奏极易引发一系列生理或心理上的问题。相比于有一定工作经验和生活阅历的成年人而言,刚刚脱离亲朋保护的大学生更容易产生问题,甚至出现退学乃至轻生等不可挽回的行为。随着信息技术的推广和应用,以数据驱动为核心的异常检测技术在学生心理健康教育领域也取得了一系列出色的成果。因此如何利用异常检测技术来处理和分析校园中的学生数据以辅助高校进行管理是一个值得研究的问题。针对这个问题,本文提出一种以数据驱动的基于异常检测技术的学生异常行为检测及分析系统,主要工作包括:(1)提出一种改进的孤立森林(Isolate Forest,iForest)和K-Means相结合的算法。改进的iForest算法主要针对传统iForest算法中存在的分支过多和得分不一致的情况,更改了分支构建过程。该方法首先使用改进的iForest算法对数据集筛选出一组异常候选,然后使用K-Means从异常候选中得出异常分类结果。(2)设计了一种基于无监督异常检测算法的学生异常行为检测及分析系统,该系统不仅具备学生心理测评的功能,还能够基于改进的iForest算法对学生的异常行为进...
【文章来源】:南京信息工程大学江苏省
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
ROC曲线示例图
南京信息工程大学硕士学位论文都可以用 AUC 来衡量分类器的效果。不同点用了 Precision,因此 PR 曲线的两个指标都聚焦心正例,所以在此情况下 PR 曲线被广泛认为优代表 TPR,纵轴代表 Precision,如图 2.3 为 PR 曲其对应的分类器的分类性能也就越好。PR 曲线来量化度量分类器的分类效果,其取值范围是[应的分类器的分类性能也就越好。本文的实验综合评估各个模型的异常检测评估性能。
常检测为孤立树的一个节点,它要么是没有子节的内部节点。每一步分割,都包含特征q数据分到rT 。1{ , , }n x x,特征的维度为d 。为了构建割值p,递归地分割数据集 X ,直到满(2)节点上只有一个样本;(3)节点上的样分步骤期间,新的候选点遍历所有树木,所示,每一个分支切口始终与坐标轴平行用任何数据点的区域却收到更多的分支
【参考文献】:
期刊论文
[1]面向智慧校园的学生异常行为检测[J]. 任孟其,宋汝鑫,王萌,邵子豪,赵国生. 哈尔滨师范大学自然科学学报. 2017(03)
[2]一种基于关联信息熵度量的特征选择方法[J]. 董红斌,滕旭阳,杨雪. 计算机研究与发展. 2016(08)
[3]基于轮廓系数的聚类有效性分析[J]. 朱连江,马炳先,赵学泉. 计算机应用. 2010(S2)
硕士论文
[1]数据挖掘在高职学生心理健康管理系统中的应用研究[D]. 陈婉.郑州大学 2017
[2]基于k-means聚类算法的大学生心理管理系统研究[D]. 吴婷.湖北工业大学 2017
[3]基于机器学习和大数据技术的高校学生行为分析[D]. 邓晗.北京邮电大学 2017
[4]基于SVM的满意特征选择及其在企业信用评估中的应用[D]. 凌健.厦门大学 2007
[5]数据挖掘在大学生心理问题中的应用研究[D]. 任丽君.华东师范大学 2006
本文编号:3521381
【文章来源】:南京信息工程大学江苏省
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
ROC曲线示例图
南京信息工程大学硕士学位论文都可以用 AUC 来衡量分类器的效果。不同点用了 Precision,因此 PR 曲线的两个指标都聚焦心正例,所以在此情况下 PR 曲线被广泛认为优代表 TPR,纵轴代表 Precision,如图 2.3 为 PR 曲其对应的分类器的分类性能也就越好。PR 曲线来量化度量分类器的分类效果,其取值范围是[应的分类器的分类性能也就越好。本文的实验综合评估各个模型的异常检测评估性能。
常检测为孤立树的一个节点,它要么是没有子节的内部节点。每一步分割,都包含特征q数据分到rT 。1{ , , }n x x,特征的维度为d 。为了构建割值p,递归地分割数据集 X ,直到满(2)节点上只有一个样本;(3)节点上的样分步骤期间,新的候选点遍历所有树木,所示,每一个分支切口始终与坐标轴平行用任何数据点的区域却收到更多的分支
【参考文献】:
期刊论文
[1]面向智慧校园的学生异常行为检测[J]. 任孟其,宋汝鑫,王萌,邵子豪,赵国生. 哈尔滨师范大学自然科学学报. 2017(03)
[2]一种基于关联信息熵度量的特征选择方法[J]. 董红斌,滕旭阳,杨雪. 计算机研究与发展. 2016(08)
[3]基于轮廓系数的聚类有效性分析[J]. 朱连江,马炳先,赵学泉. 计算机应用. 2010(S2)
硕士论文
[1]数据挖掘在高职学生心理健康管理系统中的应用研究[D]. 陈婉.郑州大学 2017
[2]基于k-means聚类算法的大学生心理管理系统研究[D]. 吴婷.湖北工业大学 2017
[3]基于机器学习和大数据技术的高校学生行为分析[D]. 邓晗.北京邮电大学 2017
[4]基于SVM的满意特征选择及其在企业信用评估中的应用[D]. 凌健.厦门大学 2007
[5]数据挖掘在大学生心理问题中的应用研究[D]. 任丽君.华东师范大学 2006
本文编号:3521381
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3521381.html