基于在线学习的直接优化AUC算法研究

发布时间:2021-03-16 00:49
  分类学习作为机器学习和数据挖掘的重要研究领域,其中二分类学习由于它的广泛的应用受到众多学者的关注。传统二分类算法大多数关注平衡环境,而在实际应用中,真实数据在两个类别之间存在不一致,对此很多学者对不平衡二分类问题产生了浓厚的兴趣,其中针对不平衡二分类问题提出了很多直接优化不平衡分类准则的算法,作为其中的代表,直接优化AUC算法由于关注的是正负样本之间的偏序关系,因此逐渐成为研究的热点,也取得了良好的效果。已有的多数直接优化AUC算法采用批学习方式,这样使得一次计算时需要存储大量的样本和计算所有样本的梯度信息,其效果降低并且不适合大规模数据场景。在此背景下,本文将在线学习和直接优化AUC相结合,提出研究面向大规模数据的在线优化AUC算法,利用在线学习在大规模环境下的优势,首先提出了基于自适应正则项的在线AUC优化算法,随后针对大规模高维环境,提出了基于自适应更新的稀疏在线AUC优化算法,现将本文的主要工作总结如下:(1)针对传统的在线学习只适合处理单样本数据,并不适合处理面向AUC的样本对问题,因此本文提出了基于自适应正则项的在线AUC优化算法。具体而言,通过假定模型符合多元高斯分布,i... 

【文章来源】:安徽大学安徽省 211工程院校

【文章页数】:64 页

【学位级别】:硕士

【部分图文】:

基于在线学习的直接优化AUC算法研究


二分类示意图

基于在线学习的直接优化AUC算法研究


AUC效果示意图

基于在线学习的直接优化AUC算法研究


ArowOAM算法的策略有效性对比结果

【参考文献】:
期刊论文
[1]基于数据重平衡的AUC优化Boosting算法[J]. 李秋洁,茅耀斌.  自动化学报. 2013(09)
[2]一种文本处理中的朴素贝叶斯分类器[J]. 李静梅,孙丽华,张巧荣,张春生.  哈尔滨工程大学学报. 2003(01)

硕士论文
[1]基于支持向量机的不平衡数据集分类算法研究[D]. 郝姝雯.哈尔滨工程大学 2011



本文编号:3085114

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3085114.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c7446***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com