基于非均衡数据的传统分类模型研究
【学位授予单位】:山西大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP18;F832.4
【图文】:
图 1.1 论文的结构1.4 本文结构安排第一章是绪论,主要总结了本文的研究背景和意义,指出了解决相关非均衡数据问题的必要性。总结了国内外的研究现状,论文的研究内容和论文结构。第二章主要介绍 SMOTE 过采样法和 EasyEnsemble 欠采样法的算法思想和算法步骤以及本文所涉及到的传统分类模型的基本形式。第三章介绍本文提出数据采样法:SMOTE-EN+F 法,包括 SMOTE-EN+F 法的思想和步骤。同时在传统分类模型的基础上,通过 UCI 数据,验证了以传统分类模型为基模型的 SMOTE-EN+F 法可以提升传统分类模型对非均衡数据集的分类性能第四章主要介绍本文提出的另一种方法:基于 Logistic 分类模型的置信度阈值法。首先介绍置信度阈值法的计算过程,然后使用 UCI 数据集验证此方法的合理性。第五章将本文提到的 SMOTE-EN+F 法和基于 Logistic 分类模型的置信度阈值法应用到信贷机构的贷款数据上,对逾期和未逾期客户进行分类,确定出有效的信用评
图 2.1 神经网络连接图 2.1 所示,每次输入都对应输出,在输入与输出中间起关键作用的函数的作用是对如何来激活输入信号的总和做出决定。所以了解了掌握神经网络的要领。网络中经常使用的一个激活函数是 sigmoid 函数,也称 S 型函数,入输出发生连续性的变化平滑的曲线。如图 2.2。moid 函数为:1( )1 exp( )h x x.x3
基于非均衡数据的传统分类模型研究 sigmoid 函数也存在一定问题,即非零中心化会带来更新缓慢。将激活进为 ReLU 函数,ReLU 函数是最近使用较多的激活函数,函数形式如数学表达式为: ( ) = { ( 0)0 ( 0).U 函数的近似线性性可以体现在很大的区间内,在一定程度上避免了梯爆炸的问题。同时,也有单侧抑制的优点:当神经元的输入小于 0 时,,神经元未被激活,与之相连接的权重边不再重复,这样就减少了参数络的稀疏化减小了过拟合的可能。不过也存在一定的缺点,那就是神经就很难再次激活。ReLU 函数图如图 2.3:
【相似文献】
相关期刊论文 前10条
1 龙克礼;;分析好 大有益——评选好新闻的一点感受[J];新闻界;1988年03期
2 郝文荣;;反义词传统分类与琼斯新分类之比较(英文)[J];考试与评价(大学英语教研版);2016年04期
3 贡斯琴;;蒙药传统分类与现代分类之比较[J];中国民族民间医药;2010年23期
4 焦彤,王戈;我看经济学[J];改革与理论;2002年07期
5 于青圃;中药新的分类模式述要[J];中医药学刊;2004年08期
6 林木;刑事科学技术的传统分类[J];中国人民警官大学学报(自然科学版);1996年03期
7 王健,黎晓敏,贾仁勇,宋维平,李明元,杨本登;中药的传统分类与无机元素关系的研究[J];四川农业大学学报;1996年04期
8 贾敬华;;“58同城”进化论:移动互联下的生活服务平台[J];金融经济;2014年11期
9 吕付勇;;做守法的基督徒[J];中国天主教;2011年05期
10 刘大江;谈俄罗斯现行刑法典[J];法学杂志;1998年05期
相关会议论文 前1条
1 沈世杰;;鱼类传统分类面临的危机[A];中国海洋湖沼动物学会鱼类学分会第七届会员代表大会暨朱元鼎教授诞辰110周年庆学术研讨会学术论文摘要集[C];2006年
相关重要报纸文章 前3条
1 本报记者 李大庆;“五花八门”的学者研讨城市健康与福祉[N];科技日报;2016年
2 徐俊彪;清凉一族网上行[N];中华建筑报;2000年
3 见习记者 杨琳桦;博客要来一场Tag革命[N];21世纪经济报道;2005年
相关硕士学位论文 前5条
1 赵慧;基于非均衡数据的传统分类模型研究[D];山西大学;2019年
2 王鹰;中药临床分类客观化初步研究[D];中国中医科学院;2012年
3 郭梅娜;中国圆瓢蜡蝉属分类及其DNA条形码研究[D];贵州大学;2015年
4 芦荣胜;尺蛾科,灯蛾科部分种类酯酶同工酶的研究[D];陕西师范大学;2000年
5 李金金;汉语歇后语的认知研究[D];江西师范大学;2008年
本文编号:2789404
本文链接:https://www.wllwen.com/jingjilunwen/huobiyinxinglunwen/2789404.html