极限学习机并行化算法及在NO_x排放预测中的应用
发布时间:2017-07-04 13:22
本文关键词:极限学习机并行化算法及在NO_x排放预测中的应用
更多相关文章: 极限学习机 大数据 MapReduce 粒子群算法 NO_x排放
【摘要】:极限学习机(Extreme Learning Machine, ELM)以其学习速度快、训练参数少和泛化性能好等特点,被广泛应用于数据挖掘中。但是面对如今的大规模数据,极限学习机与传统的机器学习算法一样,由于受到计算机内存的限制,训练时间太长,甚至有可能无法运行。针对以上问题,本文将极限学习机与当下流行的大数据技术相结合,利用MapReduce这个并行框架来实现极限学习机的并行化,使极限学习机达到高效处理大规模数据的目的。随着经济的迅猛发展,能源消耗随之逐年增加。我国能源结构以煤为主,燃煤电厂产生的NO_x日趋严重,如何有效地控制NO_x的排放一直是人们关注的焦点。随着工业4.0的提出和存储技术的提高,工业处于一个数据爆发的时代,每时每刻都在产生新的数据,数据库的存储量也日益增加。为应对我国火电行业信息化建设出现的大规模数据,寻找行之有效的大规模数据处理技术已经成为一个热门研究。本文的主要工作如下:(1)针对传统极限学习机集成方法无法有效处理大规模数据的问题,提出基于MapReduce框架的并行化极限学习机集成方法。通过分析极限学习机的集成方法,发现每个极限学习机网络的训练为并列独立进行,证明该过程是可以分解的。该算法由一个MapReduce Job实现,Map阶段将集成学习中的每个极限学习机网络并行地训练。通过实验证明该算法在精确度上和单机极限学习机集成方法几乎一样,但训练速度更快,可以更加高效地处理大规模数据。(2)针对极限学习机随机初始化输入权值和隐含层偏置,可能存在非最优的输入权值和隐含层偏置的问题,提出基于MapReduce框架的并行化粒子群极限学习机方法。研究发现,在粒子群极限学习机算法的运算过程中,粒子适应度值的计算与样本的大小有关,若样本太大会导致训练时间过长等问题。而适应度函数采用极限学习机网络的误差,极限学习机在求解输出权值的Moore-Penrose广义逆中矩阵乘法是计算量最大的部分,由于其可以分解,故将其并行化。通过实验证明,相比极限学习机,该算法得到了较高的预测准确率。(3)将本文提出的极限学习机并行化算法应用到NO_x排放预测中。通过分析锅炉运行参数及影响NO_x排放特性的因素,确定极限学习机的输入输出参数,建立NO_x的排放预测模型。并通过实验验证了本文提出方法的有效性。
【关键词】:极限学习机 大数据 MapReduce 粒子群算法 NO_x排放
【学位授予单位】:太原理工大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP181
【目录】:
- 摘要4-6
- ABSTRACT6-13
- 主要符号索引13-15
- 第一章 绪论15-25
- 1.1 课题背景及选题意义15-17
- 1.2 国内外相关研究进展17-21
- 1.2.1 极限学习机研究现状17-19
- 1.2.2 大规模的数据挖掘研究现状19-21
- 1.2.3 NO_x排放预测研究现状21
- 1.3 研究内容与组织结构21-25
- 第二章 相关技术25-37
- 2.1 NO_x的生成机理25-26
- 2.1.1 热力型NO_x25-26
- 2.1.2 快速型NO_x26
- 2.1.3 燃料型NO_x26
- 2.2 极限学习机26-29
- 2.3 Hadoop大数据技术29-35
- 2.3.1 HDFS分布式文件系统30-33
- 2.3.2 MapReduce编程框架33-35
- 2.4 本章小结35-37
- 第三章 基于MapReduce的并行化极限学习机37-49
- 3.1 基于分治策略的极限学习机37-38
- 3.2 基于MapReduce的并行化ELM算法38-41
- 3.2.1 算法分析与设计38-39
- 3.2.2 算法实现39-41
- 3.3 实验分析41-48
- 3.3.1 Hadoop平台的总体设计41-43
- 3.3.2 实验结果与分析43-48
- 3.4 本章小结48-49
- 第四章 基于MapReduce的并行化粒子群极限学习机49-61
- 4.1 粒子群算法49-51
- 4.1.1 粒子群算法49-50
- 4.1.2 PSO-ELM算法50-51
- 4.2 基于MapReduce的并行化PSO-ELM算法51-56
- 4.2.1 算法分析与设计51-53
- 4.2.2 算法实现53-56
- 4.3 实验结果与分析56-60
- 4.4 本章小结60-61
- 第五章 基于并行化极限学习机的NO_x排放预测61-69
- 5.1 基于MapReduce的并行化NO_x排放模型61-63
- 5.1.1 锅炉燃烧设备状况61-62
- 5.1.2 输入与输出的设计62
- 5.1.3 数据采集及其预处理62-63
- 5.2 实验分析63-66
- 5.2.1 基于PV-ELM的NO_x建模实验63-65
- 5.2.2 基于DPSO-ELM的NO_x建模实验65-66
- 5.3 本章小结66-69
- 第六章 总结与展望69-71
- 6.1 全文总结69-70
- 6.2 研究展望70-71
- 参考文献71-77
- 致谢77-79
- 攻读硕士学位期间发表的论文79
【相似文献】
中国期刊全文数据库 前10条
1 吴正娟;职为梅;杨勇;范明;;并行化的粒子群技术[J];微计算机信息;2009年36期
2 齐书阳;;迎接并行化的明天[J];软件世界;2009年06期
3 曹琳,杨学军,金国华;两种并行化机制的分析[J];计算机研究与发展;1993年09期
4 金国华,,陈福接;并行化技术与工具[J];计算机研究与发展;1996年07期
5 蔡立志,童维勤,廖文昭;序列拼装程序的并行化研究与实现[J];计算机工程与应用;2003年14期
6 王伟;潘建伟;;有限差分法的并行化计算实现[J];电脑知识与技术;2008年07期
7 程锦松;;迭代法的并行化[J];安徽大学学报(自然科学版);1997年03期
8 陈再高;王s
本文编号:517963
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/517963.html