当前位置:主页 > 科技论文 > 软件论文 >

异常检测的动态代价敏感学习深度置信网络研究

发布时间:2021-01-15 08:38
  随着大数据技术的发展,数据量不断扩大,源源不断的数据中很可能包括异常数据、欺诈数据等,这些数据会带来严重的影响,不仅会影响人们的生活、工作,而且会影响社会甚至国家的安全。故检测出异常数据、欺诈数据已经成为迫在眉睫的工作。这些数据都属于非平衡数据,非平衡数据是数据集中不同类别的数据数目相差很多,这些异常数据需要我们学习它们的特征并进行有效的预测。现有的非平衡数据处理方法有数据层面和算法层面的方法,数据层面的方法的弊端是当数据量增大时,处理所需的时间复杂度会呈倍数增长;算法层面的方法包括机器学习的方法、深度学习的方法和集成学习方法等。随着深度学习的发展,神经网络技术也逐步发展,在异常检测或者欺诈检测中,神经网络技术因其可以模拟人脑功能的基本特征,从而有着识别率高、稳定性好的特点。另外考虑到异常数据标签数据少以及人工标注的成本较高的特点,引入半监督学习的概念,半监督学习通过将无标签数据加入到有标签数据的训练中,从而提高分类器学习的性能。本文在此基础上对异常检测做出如下研究:(1)调研了异常检测技术国内外研究现状和发展趋势,对前人的研究成果进行了归纳和总结,对现有主要的异常检测算法的理论和方法... 

【文章来源】:南京财经大学江苏省

【文章页数】:67 页

【学位级别】:硕士

【部分图文】:

异常检测的动态代价敏感学习深度置信网络研究


半监督学习过程

模型图,模型,反向传播


图 3.1 RBM 模型制玻尔兹曼机为多个 RBM 顺序连接组成的,由一个可视层和自下而上分别训练 RBM 的参数,当训练完第一个 RBM 后,为下一个 RBM 的可见层,该 RBM 的输出作为下一个 RBM直至达到最后一个 RBM,将最后一个 RBM 的输出作为多个输出。同时 RBM 又能够通过自身来重建数据,可见层与第一多次正向和反向传播,正向传播则为上面涉及的内容,反向传后的输出作为反向传播的输入,该输入乘以对应节点连接线可见层的偏置值,得到新的输出项,这个输出项则为对原始输,与原始输入数据之间的差异叫作重建误差,该重建误差沿反向传播,迭代进行,直至达到误差最小值。在多层限制玻尔一个新的隐藏层,该层连接的权重会通过迭代反复调整,直至层的输入,这种方法也被称作非监督贪婪逐层预训练方法。传递时,输入通过 RBM 可以得到输出的概率,这个概率也称

网络结构图,网络结构,隐藏层,数据集


DBN网络结构

【参考文献】:
期刊论文
[1]基于边界混合采样的非均衡数据处理算法[J]. 冯宏伟,姚博,高原,王惠亚,冯筠.  控制与决策. 2017(10)
[2]基于多类重采样的非平衡数据极速学习机集成学习[J]. 邢胜,王熙照,王晓兰.  南京大学学报(自然科学). 2016(01)
[3]基于遗传算法改进的少数类样本合成过采样技术的非平衡数据集分类算法[J]. 霍玉丹,谷琼,蔡之华,袁磊.  计算机应用. 2015(01)
[4]一种新的不平衡数据学习算法PCBoost[J]. 李雄飞,李军,董元方,屈成伟.  计算机学报. 2012(02)
[5]非平衡类数据分类概述[J]. 钱洪波,贺广南.  计算机工程与科学. 2010(05)
[6]处理非平衡数据的粒度SVM学习算法[J]. 郭虎升,亓慧,王文剑.  计算机工程. 2010(02)
[7]一种基于核SMOTE的非平衡数据集分类方法[J]. 曾志强,吴群,廖备水,高济.  电子学报. 2009(11)



本文编号:2978597

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2978597.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户96fc9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com