面向大数据的在线RBF模型构建及其应用研究
发布时间:2021-03-03 01:49
随着通信技术的发展和互联网的快速普及,各行业中的电子化数据越来越多,数据收集也越发简单,我们迎来了大数据时代。大数据的发展亦推动了消费形式的多样性发展,但是大数据在为人们创造巨大使用价值的同时,也给以淘宝网为代表的各大电商企业带来了一些新的挑战。随着数据规模的迅速扩张,传统的离线算法无法实现一次性收集全部的信息,将会耗费大量的时间和空间。在线学习技术则可以很好的解决这一问题,成为大数据集的数据挖掘领域的研究热点。本文主要研究面向大数据的在线RBF的学习算法及其应用。论文的主要工作有以下三个内容:(1)在对径向基函数研究的基础上,采用高斯函数作为核函数,利用数学中的分块矩阵定理对径向基函数进行处理,从在线处理大数据的角度思考,利用增量学习算法原理推导出径向基函数(RBF)增量学习算法模型,为大数据的增量算法提供一种新思路,并利用实际算例加以检验。实验表明,相对于传统的一次性建模的方法,本文提出的增量式RBF算法能在保证不影响建模精度的前提下明显地缩短处理大数据的时间。(2)在本文研究的RBF增量式学习算法的研究基础上进行改进,利用固定滑动窗口原理,通过利用数学中的分块矩阵定理对径向基函数...
【文章来源】:南京邮电大学江苏省
【文章页数】:75 页
【学位级别】:硕士
【部分图文】:
淘宝网大数据工具时间轴IBM大数据行业研究者指出,大数据定义主要有两层框架
也是在这个阶段,人们开始在各个领域的知识信息管理中使用一些基本工具以及相关技术来实现企业的科学管理。刚开始,大数据技术的重点调研内容Algorithms)以及识别(Identification)等方面[14]。随着相关技术的进步,大数据渐得到突破。在这个阶段,通过非结构化数据的研究使得大数据技术得到更好的之前,计算机信息处理技术通常是应用于获取数据信息,对数据信息进行一定的,并将有针对性的数据存储起来,从而方便各软件平台数据信息的输入。随着信速发展,海量数据信息不断生成,所需的数据存储空间越来越大,因此,只有提的存储技术,保证数据信息的安全性和稳定性,才能提高计算机信息处理的效率数据在我国开始逐渐普及起来,人们也意识到了大数据的重要性,在“十二五”甚至门设立了研究大数据的机构。与此同时,行业内也在不遗余力的推动大数据,社会各界给予大数据的关注在某种程度上亦推动了大数据的发展。2017 年 12 主席在中共中央政治局第二次会议时提出“实施国家大数据战略加快建设数字中,这也代表着我国对大数据的重视上升到了一个新的高度。
将上述方程的各个参数取值分别如下:t 0.01,1p -1.1,2p 0.4, q 1.6, w 1.8。当确定了各个参数后,再通过如下采样规则:2 1 1x (t ) ( x (t 1), x (t 1), t (t )),2y (t ) x (本集 1( ), ( )Ntx t y t , N 为样本容量,利用样本对 组成窗式样本集,选窗口 N=4,核函数采用高斯函数: 2exp( / )i i x x x x , =0.01(可调),用在线函数的学习算法对此混沌信号进行在线学习,利用滑动窗口的思想,即样本呈现窗式本实验的窗口长度为 4,当时刻 t 的逐一递进时,向窗口中添加一个新的样本,与此同固定窗口中的一个旧的样本,从而保持窗口长度保持不变,逐一训练样本集,直至样的数据全部训练结束,此时窗口式在线 RBF 学习结束。 (1)()(()()()cos())(1)()()32211221112xtxtpxtpxtxtqwttxtxtxtt
【参考文献】:
期刊论文
[1]基于滑动窗口挖掘数据流高效用项集的有效算法[J]. 郭世明,高宏. 哈尔滨工程大学学报. 2018(04)
[2]基于径向基函数的分数年龄假设[J]. 周晓剑. 统计与决策. 2016(01)
[3]大数据在淘宝网电子商务模式创新中的应用研究[J]. 陈原,刘惠,周文豪. 价值工程. 2015(35)
[4]基于径向基神经网络的储粮通风智能决策研究[J]. 孙彪瑞,廉飞宇,王珂,苏庭奕,张元. 粮食与饲料工业. 2014(09)
[5]径向基函数神经网络在网络安全预测中的应用[J]. 蓝新波,李冬睿. 计算机测量与控制. 2014(03)
[6]基于Duffing振子的微弱周期信号混沌检测性能研究[J]. 范剑,赵文礼,王万强. 物理学报. 2013(18)
[7]阿里“玩”大数据[J]. 崔婧. 中国经济和信息化. 2013(08)
[8]阿里大数据战略探析[J]. 黄丹丹,王明宇,刘淑贞. 中国商贸. 2013(12)
[9]大数据管理:概念、技术与挑战[J]. 孟小峰,慈祥. 计算机研究与发展. 2013(01)
[10]大数据研究:未来科技及经济社会发展的重大战略领域——大数据的研究现状与科学思考[J]. 李国杰,程学旗. 中国科学院院刊. 2012(06)
博士论文
[1]径向基函数逼近中的若干理论、方法及其应用[D]. 马利敏.复旦大学 2009
本文编号:3060364
【文章来源】:南京邮电大学江苏省
【文章页数】:75 页
【学位级别】:硕士
【部分图文】:
淘宝网大数据工具时间轴IBM大数据行业研究者指出,大数据定义主要有两层框架
也是在这个阶段,人们开始在各个领域的知识信息管理中使用一些基本工具以及相关技术来实现企业的科学管理。刚开始,大数据技术的重点调研内容Algorithms)以及识别(Identification)等方面[14]。随着相关技术的进步,大数据渐得到突破。在这个阶段,通过非结构化数据的研究使得大数据技术得到更好的之前,计算机信息处理技术通常是应用于获取数据信息,对数据信息进行一定的,并将有针对性的数据存储起来,从而方便各软件平台数据信息的输入。随着信速发展,海量数据信息不断生成,所需的数据存储空间越来越大,因此,只有提的存储技术,保证数据信息的安全性和稳定性,才能提高计算机信息处理的效率数据在我国开始逐渐普及起来,人们也意识到了大数据的重要性,在“十二五”甚至门设立了研究大数据的机构。与此同时,行业内也在不遗余力的推动大数据,社会各界给予大数据的关注在某种程度上亦推动了大数据的发展。2017 年 12 主席在中共中央政治局第二次会议时提出“实施国家大数据战略加快建设数字中,这也代表着我国对大数据的重视上升到了一个新的高度。
将上述方程的各个参数取值分别如下:t 0.01,1p -1.1,2p 0.4, q 1.6, w 1.8。当确定了各个参数后,再通过如下采样规则:2 1 1x (t ) ( x (t 1), x (t 1), t (t )),2y (t ) x (本集 1( ), ( )Ntx t y t , N 为样本容量,利用样本对 组成窗式样本集,选窗口 N=4,核函数采用高斯函数: 2exp( / )i i x x x x , =0.01(可调),用在线函数的学习算法对此混沌信号进行在线学习,利用滑动窗口的思想,即样本呈现窗式本实验的窗口长度为 4,当时刻 t 的逐一递进时,向窗口中添加一个新的样本,与此同固定窗口中的一个旧的样本,从而保持窗口长度保持不变,逐一训练样本集,直至样的数据全部训练结束,此时窗口式在线 RBF 学习结束。 (1)()(()()()cos())(1)()()32211221112xtxtpxtpxtxtqwttxtxtxtt
【参考文献】:
期刊论文
[1]基于滑动窗口挖掘数据流高效用项集的有效算法[J]. 郭世明,高宏. 哈尔滨工程大学学报. 2018(04)
[2]基于径向基函数的分数年龄假设[J]. 周晓剑. 统计与决策. 2016(01)
[3]大数据在淘宝网电子商务模式创新中的应用研究[J]. 陈原,刘惠,周文豪. 价值工程. 2015(35)
[4]基于径向基神经网络的储粮通风智能决策研究[J]. 孙彪瑞,廉飞宇,王珂,苏庭奕,张元. 粮食与饲料工业. 2014(09)
[5]径向基函数神经网络在网络安全预测中的应用[J]. 蓝新波,李冬睿. 计算机测量与控制. 2014(03)
[6]基于Duffing振子的微弱周期信号混沌检测性能研究[J]. 范剑,赵文礼,王万强. 物理学报. 2013(18)
[7]阿里“玩”大数据[J]. 崔婧. 中国经济和信息化. 2013(08)
[8]阿里大数据战略探析[J]. 黄丹丹,王明宇,刘淑贞. 中国商贸. 2013(12)
[9]大数据管理:概念、技术与挑战[J]. 孟小峰,慈祥. 计算机研究与发展. 2013(01)
[10]大数据研究:未来科技及经济社会发展的重大战略领域——大数据的研究现状与科学思考[J]. 李国杰,程学旗. 中国科学院院刊. 2012(06)
博士论文
[1]径向基函数逼近中的若干理论、方法及其应用[D]. 马利敏.复旦大学 2009
本文编号:3060364
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3060364.html