可变隶属度2C-FSVM的研究及其辅助认定贫困生的应用
发布时间:2022-12-09 17:40
贫困生认定是目前高校学生工作的重要内容,是公平、公正、合理分配资助资源的重要前提。目前的大数据和机器学习技术则为贫困生精准认定提供了有效的解决途径。本文针对由于贫困生占比少而导致的数据不平衡、存在各种导致虚假认定的干扰因素等不确定性现象,提出了一种可变隶属度2C-FSVM(Dual-C-parameter Fuzzy Support Vector Machine)模型,并将其应用到贫困生辅助认定中。可变隶属度2C-FSVM模型不仅能够更好地解决实际贫困生数据集的不确定性、类不平衡性敏感的问题,而且还可以基于样本距离类中心的远近而采用不同的模糊隶属度计算方式,更细致地刻画数据样本点的不确定性。基于该模型,本文实现了一个有效的贫困生认定方法,不仅能更准确地实现贫困生的辅助认定,还能帮助发现“隐形贫困”和“虚假认定”的学生,从而提升高校的贫困生认定的效率和准确度,促进精准资助。首先,本文调研了贫困生认定问题的研究现状和支持向量机的研究现状,并重点分析了支持向量机中类不平衡问题和不确定性问题的研究发展现状。接着,对本文用到的技术进行了介绍,主要包括:支持向量机分类技术、基于随机森林的特征选择技...
【文章页数】:81 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 论文研究背景与意义
1.2 论文研究内容
1.3 论文组织结构
第二章 研究现状
2.1 贫困生认定研究现状
2.2 支持向量机研究现状
2.2.1 针对类不平衡问题的支持向量机研究现状
2.2.2 模糊支持向量机研究现状
2.2.3 现有方法的不足之处
2.3 本章小结
第三章 相关技术介绍
3.1 支持向量机
3.1.1 支持向量机的基本原理
3.1.2 标准支持向量机
3.1.3 代价敏感支持向量机
3.1.4 模糊支持向量机
3.2 随机森林排名
3.3 类不平衡数据集的分类评价法
3.3.1 敏感性、特异性及其几何平均值
3.3.2 ROC与ROC_AUC
3.4 K折交叉验证法
3.5 本章小结
第四章 可变隶属度2C-FSVM模型
4.1 可变隶属度2C-FSVM模型
4.2 模型求解
4.3 可变模糊隶属度的计算
4.3.1 基于距离类中心距离的隶属度计算
4.3.2 基于紧密度的隶属度计算
4.3.3 基于距离和紧密度的可变隶属度
4.3.4 可变隶属度计算流程
4.4 正负类惩罚参数的设置
4.5 模型分析
4.6 公开数据集实验
4.6.1 实验环境
4.6.2 公开数据集介绍
4.6.3 实验设置
4.6.4 03 subcl5-600-5-0-BI数据集上的实验结果
4.6.5 03 subcl5-600-5-30-BI数据集上的实验结果
4.6.6 03 subcl5-600-5-60-BI数据集上的实验结果
4.6.7 03 subcl5-800-7-30-BI数据集上的实验结果
4.6.8 04 clover5z-800-7-30-BI数据集上的实验结果
4.6.9 实验结果分析
4.7 本章小结
第五章 应用可变隶属度2C-FSVM辅助认定贫困生
5.1 整体流程
5.2 数据采集
5.2.1 一卡通月流水记录数据表
5.2.2 贫困生名单表
5.2.3 学生基本数据表
5.3 数据预处理
5.4 数据初步分析
5.5 特征工程
5.6 实验设置
5.7 实验结果及分析
5.8 贫困生辅助认定
5.9 本章小结
总结与展望
研究工作总结
工作展望
参考文献
攻读硕士学位期间取得的研究成果
致谢
附件
【参考文献】:
期刊论文
[1]基于三支决策的不平衡数据过采样方法[J]. 胡峰,王蕾,周耀. 电子学报. 2018(01)
[2]一卡通食堂消费数据的聚类及关联规则分析[J]. 马乐之. 电子世界. 2018(01)
[3]高校家庭经济困难学生精准认定方法初探[J]. 黄丹. 才智. 2017(35)
[4]深刻把握我国社会主要矛盾转化的新特点[J]. 韩庆祥. 政策瞭望. 2017(10)
[5]家庭经济困难学生认定工作中的问题和完善措施[J]. 朱玉,杨立娜,吴倩. 科技经济导刊. 2017(27)
[6]“隐形资助”:见证一个社会的温度[J]. 张军. 师道. 2017(09)
[7]基于谱聚类与支持向量机的高校经济困难学生认定方法研究[J]. 莫媛媛,顾明言,张辉宜. 中国教育信息化. 2017(15)
[8]信息扶贫助力打赢脱贫攻坚战[J]. 秦仁. 中国电信业. 2017(07)
[9]大数据时代精准识别高校贫困生研究[J]. 孙梦,高峰. 北京劳动保障职业学院学报. 2017(02)
[10]基于数据挖掘的校园一卡通数据应用研究——以石家庄学院为例[J]. 冯玖,李俊玲,张海霞,郭鹏,赵峰,谢通. 石家庄学院学报. 2017(03)
硕士论文
[1]基于Hadoop的校园卡数据挖掘的研究与实现[D]. 戴海辉.南昌航空大学 2017
本文编号:3715080
【文章页数】:81 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 论文研究背景与意义
1.2 论文研究内容
1.3 论文组织结构
第二章 研究现状
2.1 贫困生认定研究现状
2.2 支持向量机研究现状
2.2.1 针对类不平衡问题的支持向量机研究现状
2.2.2 模糊支持向量机研究现状
2.2.3 现有方法的不足之处
2.3 本章小结
第三章 相关技术介绍
3.1 支持向量机
3.1.1 支持向量机的基本原理
3.1.2 标准支持向量机
3.1.3 代价敏感支持向量机
3.1.4 模糊支持向量机
3.2 随机森林排名
3.3 类不平衡数据集的分类评价法
3.3.1 敏感性、特异性及其几何平均值
3.3.2 ROC与ROC_AUC
3.4 K折交叉验证法
3.5 本章小结
第四章 可变隶属度2C-FSVM模型
4.1 可变隶属度2C-FSVM模型
4.2 模型求解
4.3 可变模糊隶属度的计算
4.3.1 基于距离类中心距离的隶属度计算
4.3.2 基于紧密度的隶属度计算
4.3.3 基于距离和紧密度的可变隶属度
4.3.4 可变隶属度计算流程
4.4 正负类惩罚参数的设置
4.5 模型分析
4.6 公开数据集实验
4.6.1 实验环境
4.6.2 公开数据集介绍
4.6.3 实验设置
4.6.4 03 subcl5-600-5-0-BI数据集上的实验结果
4.6.5 03 subcl5-600-5-30-BI数据集上的实验结果
4.6.6 03 subcl5-600-5-60-BI数据集上的实验结果
4.6.7 03 subcl5-800-7-30-BI数据集上的实验结果
4.6.8 04 clover5z-800-7-30-BI数据集上的实验结果
4.6.9 实验结果分析
4.7 本章小结
第五章 应用可变隶属度2C-FSVM辅助认定贫困生
5.1 整体流程
5.2 数据采集
5.2.1 一卡通月流水记录数据表
5.2.2 贫困生名单表
5.2.3 学生基本数据表
5.3 数据预处理
5.4 数据初步分析
5.5 特征工程
5.6 实验设置
5.7 实验结果及分析
5.8 贫困生辅助认定
5.9 本章小结
总结与展望
研究工作总结
工作展望
参考文献
攻读硕士学位期间取得的研究成果
致谢
附件
【参考文献】:
期刊论文
[1]基于三支决策的不平衡数据过采样方法[J]. 胡峰,王蕾,周耀. 电子学报. 2018(01)
[2]一卡通食堂消费数据的聚类及关联规则分析[J]. 马乐之. 电子世界. 2018(01)
[3]高校家庭经济困难学生精准认定方法初探[J]. 黄丹. 才智. 2017(35)
[4]深刻把握我国社会主要矛盾转化的新特点[J]. 韩庆祥. 政策瞭望. 2017(10)
[5]家庭经济困难学生认定工作中的问题和完善措施[J]. 朱玉,杨立娜,吴倩. 科技经济导刊. 2017(27)
[6]“隐形资助”:见证一个社会的温度[J]. 张军. 师道. 2017(09)
[7]基于谱聚类与支持向量机的高校经济困难学生认定方法研究[J]. 莫媛媛,顾明言,张辉宜. 中国教育信息化. 2017(15)
[8]信息扶贫助力打赢脱贫攻坚战[J]. 秦仁. 中国电信业. 2017(07)
[9]大数据时代精准识别高校贫困生研究[J]. 孙梦,高峰. 北京劳动保障职业学院学报. 2017(02)
[10]基于数据挖掘的校园一卡通数据应用研究——以石家庄学院为例[J]. 冯玖,李俊玲,张海霞,郭鹏,赵峰,谢通. 石家庄学院学报. 2017(03)
硕士论文
[1]基于Hadoop的校园卡数据挖掘的研究与实现[D]. 戴海辉.南昌航空大学 2017
本文编号:3715080
本文链接:https://www.wllwen.com/jiaoyulunwen/gaodengjiaoyulunwen/3715080.html