当前位置:主页 > 科技论文 > 自动化论文 >

基于深度学习的分类算法研究及应用

发布时间:2017-05-26 19:10

  本文关键词:基于深度学习的分类算法研究及应用,,由笔耕文化传播整理发布。


【摘要】:随着信息技术的飞速发展,我们生活的时代充满了大量的数据,这其中包含着丰富的、有意义的信息等待挖掘。分类器是数据分析最常见的一类算法模型,首先通过对已知类别样本学习来建立分类器模型,然后利用该模型预测未知类别样本的标签。例如可以根据大量正常电子邮件的特征检测出垃圾邮件,通过网络流量的正常数据监测网络攻击行为等等。但是像垃圾邮件和网络攻击行为在生活中都是偶然发生的事件,这些数据难以收集。因此,我们仅能对易于收集的一类数据进行学习和特征描述,为其建立模型来区分它们和偶然事件,以达到预测数据类别的目的,我们将这类问题称为数据分布不均的单分类问题。支持向量数据描述(SVDD)方法适合用来解决高维、样本数据有限的单分类问题,并已取得了很好的效果,但是当目标数据分布不均、各处数据的密度相差较大时,SVDD的分类性能会受到影响。本文引入并行的思想对SVDD算法进行改进,提出一种SVDD与AP聚类算法相结合的SA_SVDD算法。算法首先对数据集进行聚类处理,使得到的每一个子类中的数据分布都较为紧凑,然后对每个子类分别进行边界描述(即SVDD分类算法),最后以所有子类的边界面作为最终的判别标准。SA_SVDD的参数可通过粒子群算法自适应优化,因此该算法只需提供数据集,中间过程的参数全部根据具体的样本自适应产生。通过对一些标准数据集验证的结果表明,SA_SVDD算法的分类性能相比于经典单分类算法有明显的提高。为了降低算法的计算量、提高准确率,本文引入深度学习中稀疏自动编码器(SAE)来对数据进行降维,提出一种深度学习与SA_SVDD算法融合的SAE_SVDD算法。其主要流程是首先利用SAE对数据进行特征压缩达到降维的目的,降低数据集的稀疏性,使数据集中各个数据点相对密集;然后使用SA_SVDD算法对降维后的数据进行学习。本文的应用背景建立在孕妇产前抑郁症调查的基础上,数据通过调查表的形式获得,并配以医生的专业诊断,将其分为患有抑郁症的孕妇和健康的孕妇。其数据特点是患病的孕妇数量较少,健康的孕妇数量较大,而描述孕妇每个数据的特征量较多,使用SA_SVDD算法对其分类运行时间过长,分类效果不佳,使用SAE_SVDD算法能有效解决上述问题。同时在UCI数据集上的实验结果表明,相对于经典单分类算法,SAE_SVDD在分类性能和计算时间上都有明显的提高。
【关键词】:深度学习 支持向量数据描述 参数优化 自适应
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP181
【目录】:
  • 摘要4-5
  • ABSTRACT5-10
  • 第一章 绪论10-15
  • 1.1 研究背景10-11
  • 1.2 研究目的和意义11-12
  • 1.3 研究现状及分析12-13
  • 1.4 本文组织与结构13-15
  • 第二章 相关算法介绍15-26
  • 2.1 支持向量数据描述(SVDD)15-18
  • 2.1.1 SVDD模型15-17
  • 2.1.2 研究现状17-18
  • 2.2 深度学习算法概述18-23
  • 2.2.1 深度学习基本思想19-20
  • 2.2.2 自动编码器20-21
  • 2.2.3 受限玻尔兹曼机21-22
  • 2.2.4 稀疏自动编码器22-23
  • 2.3 聚类算法和优化算法23-25
  • 2.3.1 AP算法23-25
  • 2.3.2 PSO算法25
  • 2.4 本章小结25-26
  • 第三章 基于深度学习的单分类算法SAE_SVDD26-36
  • 3.1 自适应的支持向量数据描述算法26-27
  • 3.2 参数自适应优化27-33
  • 3.3 SA_SVDD与深度学习结合的算法33-35
  • 3.3.1 深度学习模型33-34
  • 3.3.2 SAE_SVDD34-35
  • 3.4 本章小结35-36
  • 第四章 基于深度学习的分类算法的实验及应用36-47
  • 4.1 评估方法36-38
  • 4.2 对比算法介绍38-39
  • 4.3 SA_SVDD算法基于UCI数据集的测试39-42
  • 4.3.1 实验数据设置39
  • 4.3.2 实验结果39-42
  • 4.4 SAE_SVDD算法基于UCI数据集的测试42-43
  • 4.4.1 实验数据设置42
  • 4.4.2 实验结果42-43
  • 4.5 基于深度学习的分类算法在孕妇产前抑郁症问题中的应用43-46
  • 4.5.1 孕妇产前抑郁症的应用背景43
  • 4.5.2 孕妇产前抑郁症的分析流程43-45
  • 4.5.3 应用结果及分析45-46
  • 4.6 本章小结46-47
  • 第五章 总结与展望47-48
  • 5.1 总结47
  • 5.2 展望47-48
  • 参考文献48-51
  • 作者简介51-52
  • 致谢52

【相似文献】

中国期刊全文数据库 前10条

1 郑智捷;幻序合并分类算法[J];计算机学报;1984年05期

2 刘t

本文编号:397815


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/397815.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户6d2bf***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com