面向不平衡分类的逻辑回归算法
发布时间:2021-05-13 21:01
类分布不平衡的数据集在现实生活中大量存在,传统的成熟分类算法大多建立在数据集类分布大致平衡这一假设上,而对于类分布不平衡的数据集往往取得较差的分类效果。而且,在不平衡分类问题中往往少数类比多数类具有更重要的意义,因此不能仅仅使用准确率来评估不平衡分类算法的性能,对于不平衡分类问题可用召回率、g-mean值以及f-measure值等评估指标对不平衡分类算法进行评估。逻辑回归算法是数据挖掘中常用的分类方法,尤其对于两类分类问题。逻辑回归算法最明显的优势就是它是基于概率的分类算法并且很容易被扩展到多类问题,但是逻辑回归并不适应于不平衡分类问题,因为其目标函数是最大化每个实例被正确分类的概率的对数之和,而不考虑该实例是少数类还是多数类,这样会导致将更多的少数类实例误分为多数类。因此在逻辑回归的基础处上,本文根据类分布不平衡数据集的特点,结合传统的逻辑回归算法和三个不平衡分类问题的评价指标召回率、g-mean值以及f-measure值提出了三种适合于不平衡分类的目标函数LRM(Logistic and Recall based Metric)、GBM(G-mean based Metric)和F...
【文章来源】:郑州大学河南省 211工程院校
【文章页数】:48 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景
1.2 本文的主要贡献
1.3 本文的组织架构
2 相关知识
2.1 不平衡数据集及不平衡数据分类方法
2.1.1 不平衡数据集
2.1.2 不平衡数据分类方法
2.2 逻辑回归原理
2.3 最优化方法
2.3.1 最速下降法
2.3.2 牛顿法
2.3.3 拟牛顿法
2.4 本章小结
3 目标函数的设计
3.1 基于recall的目标函数
3.2 基于g-mean的目标函数
3.3 基于f-measure的目标函数
3.4 本章小结
4 面向不平衡分类的逻辑回归算法
4.1 算法描述
4.2 本章小结
5 实验
5.1 实验数据
5.2 实验设置
5.3 评价指标
5.4 实验结果与分析
5.5 本章小结
6 总结与展望
6.1 总结
6.2 下一步工作
参考文献
致谢
个人简介
1 个人简历
2 发表的学术论文及著作权
【参考文献】:
期刊论文
[1]一种面向非平衡数据集分类问题的组合选择方法[J]. 职为梅,郭华平,张银峰,范明. 小型微型计算机系统. 2014(04)
[2]基于密度估计的逻辑回归模型[J]. 毛毅,陈稳霖,郭宝龙,陈一昕. 自动化学报. 2014(01)
[3]多标签代价敏感分类集成学习算法[J]. 付忠良. 自动化学报. 2014(06)
[4]AdaBoost算法研究进展与展望[J]. 曹莹,苗启广,刘家辰,高琳. 自动化学报. 2013(06)
[5]基于支持向量机的不平衡数据分类的改进欠采样方法[J]. 赵自翔,王广亮,李晓东. 中山大学学报(自然科学版). 2012(06)
[6]非平衡数据集分类方法探讨[J]. 职为梅,郭华平,范明,叶阳东. 计算机科学. 2012(S1)
[7]基于改进SMOTE的非平衡数据集分类研究[J]. 王超学,潘正茂,董丽丽,马春森,张星. 计算机工程与应用. 2013(02)
[8]不平衡多分类问题的连续AdaBoost算法研究[J]. 付忠良. 计算机研究与发展. 2011(12)
[9]不平衡数据采样方法的对比学习[J]. 王晓娟,郭躬德. 微计算机信息. 2011(12)
[10]一种基于重取样的代价敏感学习算法[J]. 谷琼,袁磊,宁彬,熊启军,华丽,李文新. 计算机工程与科学. 2011(09)
博士论文
[1]拟牛顿法及其收敛性[D]. 周伟军.湖南大学 2006
硕士论文
[1]基于逻辑回归的推荐技术研究及应用[D]. 刘力银.电子科技大学 2013
本文编号:3184697
【文章来源】:郑州大学河南省 211工程院校
【文章页数】:48 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景
1.2 本文的主要贡献
1.3 本文的组织架构
2 相关知识
2.1 不平衡数据集及不平衡数据分类方法
2.1.1 不平衡数据集
2.1.2 不平衡数据分类方法
2.2 逻辑回归原理
2.3 最优化方法
2.3.1 最速下降法
2.3.2 牛顿法
2.3.3 拟牛顿法
2.4 本章小结
3 目标函数的设计
3.1 基于recall的目标函数
3.2 基于g-mean的目标函数
3.3 基于f-measure的目标函数
3.4 本章小结
4 面向不平衡分类的逻辑回归算法
4.1 算法描述
4.2 本章小结
5 实验
5.1 实验数据
5.2 实验设置
5.3 评价指标
5.4 实验结果与分析
5.5 本章小结
6 总结与展望
6.1 总结
6.2 下一步工作
参考文献
致谢
个人简介
1 个人简历
2 发表的学术论文及著作权
【参考文献】:
期刊论文
[1]一种面向非平衡数据集分类问题的组合选择方法[J]. 职为梅,郭华平,张银峰,范明. 小型微型计算机系统. 2014(04)
[2]基于密度估计的逻辑回归模型[J]. 毛毅,陈稳霖,郭宝龙,陈一昕. 自动化学报. 2014(01)
[3]多标签代价敏感分类集成学习算法[J]. 付忠良. 自动化学报. 2014(06)
[4]AdaBoost算法研究进展与展望[J]. 曹莹,苗启广,刘家辰,高琳. 自动化学报. 2013(06)
[5]基于支持向量机的不平衡数据分类的改进欠采样方法[J]. 赵自翔,王广亮,李晓东. 中山大学学报(自然科学版). 2012(06)
[6]非平衡数据集分类方法探讨[J]. 职为梅,郭华平,范明,叶阳东. 计算机科学. 2012(S1)
[7]基于改进SMOTE的非平衡数据集分类研究[J]. 王超学,潘正茂,董丽丽,马春森,张星. 计算机工程与应用. 2013(02)
[8]不平衡多分类问题的连续AdaBoost算法研究[J]. 付忠良. 计算机研究与发展. 2011(12)
[9]不平衡数据采样方法的对比学习[J]. 王晓娟,郭躬德. 微计算机信息. 2011(12)
[10]一种基于重取样的代价敏感学习算法[J]. 谷琼,袁磊,宁彬,熊启军,华丽,李文新. 计算机工程与科学. 2011(09)
博士论文
[1]拟牛顿法及其收敛性[D]. 周伟军.湖南大学 2006
硕士论文
[1]基于逻辑回归的推荐技术研究及应用[D]. 刘力银.电子科技大学 2013
本文编号:3184697
本文链接:https://www.wllwen.com/shekelunwen/ljx/3184697.html