分布式流数据分析与实时机器学习理论与应用研究

发布时间:2021-10-30 03:42
  新的时代正在兴起,复杂机器学习算法的发展以及硬件性能的指数级增长将加速新一代人工智能系统的发展,改变人们对周围世界的感知和互动方式,使人工智能可以在持续和意外变化的对抗环境中工作,并支持保障人类的安全和福祉。除了智能之外,新一代人工智能系统还需要解决至少三个挑战。首先,它们必须实时地做出反应,以支持自动驾驶和智能信息检索等新兴应用。其次,这些系统需要不断地从流数据中学习,以应对其环境的时变性。第三,当这些系统代表人类做出决策时,它们的决定需要具备可解释性。这些挑战涉及数据、模型、算法和硬件等许多层面,需要把系统、统计和优化等知识在机器学习的过程中有机地结合起来。为此,这项研究工作开展了分布式流数据分析与实时机器学习理论与应用研究。研究的策略可以概括为“一个根本,两个面向,三个层次”:“一个根本”就是在线最优化求解。流数据以在线方式提供,这意味着整个数据集不能立即获得,而是单个数据实例按顺序到达。许多传统优化方法不能继续在流数据环境下发挥作用。这项工作通过探索近似算法、自适应学习和基于自然梯度下降的二阶优化方法,来应对流数据环境中产生的三种约束(即对计算成本、查询成本的约束和复杂不等式约... 

【文章来源】:广东工业大学广东省

【文章页数】:142 页

【学位级别】:博士

【部分图文】:

分布式流数据分析与实时机器学习理论与应用研究


图3.1流计算中的资源调度示意图??Figure?3.1?Illustration?of?the?resource?allocation?in?data?stream?analytic?system.??

架构图,天河,机器学习,架构


>!??aSiftTiMjrT?t?Si8f??\it^rTi?1?>Ttilt%!UI;tit?Ti*??H^SgBSiBBSa^?—??驗戀?I??|?""";??^?i??Tianhe-2?Kylin?Cloud(custon?OpenStack)?Stream?processing??□□□___?界办015??隱a^-n?;Rn?E^Q-^??IPSb?!?Wm?mmi?mm??g*?i?^;1B^i???|f?——?^?I??v??图3.3基于天河二号HPC2的资源感知实时机器学习系统架构??Figure?3.3?The?execution?model?of?the?optimized?HPC2-ARS?framework.??与HPC2平台的连接。系统时延估计模型中各种基础参数的收集和统计、根据??HPC2-ARS算法框架所做出的弹性资源调度决策都需要设计专门的系统模块来??高效地执行。这些独立的系统模块黏合了?HPC2-ARS算法框架和天河二号HPC2??平台.使流处理引擎和优化模型无缝连接,进而弥合了物理基础架构和抽象数学??模型之间的鸿沟。如图(3.3)所示.HPC2-ARS算法框架首先复用Apache?Storm??的测量组件(MEASURER)和配置读取组件(CONFIGUREREADER)从HPC2??平台获取数据流和控制流的各项基础信息,例如.数据流速率A和计算速率^??用户自定义时延阈值7^^资源数量约束Amax,当前资源配置.数据流元组在??算子拓扑图中的时延ECO1等等,并将统计结果发送给优化组件(OPTIMIZER):??优化组件实时地执行HPC2

平均时延,理论值,资源,时延


f均时延M论{TUms)?平均ih!延辉论fi?{ms}??(c)点fl?分析?(dl情感分析??U50?rc-i-*?它?5??|??V-?I-?roM??爱?40?爱?4?/■〇,+???友?2???J35?5?3.5??。?rc*??、0—^??^?3???20?25?30?35?40?45?2?2.5?3?3.5?4??t:均时延砰论m(ms}?f?均时延0论{lUms}??(e)邮件过滤?(D智能屯网??图3.6不冋的资源配置下各个流处理用例的平均时延测M值及其理论值对比??Figure?3.6?The?comparison?between?the?measured?average?tuple?sojourn?time?and?the??estimated?ones.??第二组实验分析时延估计模型的有效性,实验结果如图(3.6)所示.其中??比较了各个用例的平均时延的测量值及其理论值。图中的横坐标表示平均时延??的理论值.纵坐标表示平均时延的测量值:图中的菱形点表示在相应的资源最优??55??


本文编号:3465980

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/3465980.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ececc***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com