基于多智能体样本交换的分散式集成学习方法研究
发布时间:2021-09-30 10:43
近年来,伴随着云计算技术和人工智能技术日益成熟和广泛应用,信息科技逐步向物联网时代进行转变,人类社会的生活方式迎来了全新的变革,进入了万物互联的智能社会,万物具有感知能力,普通的物理设备不只是“冷冰冰的机器”,它拥有类似人类的感知能力和思维方式。与此同时,随着5G高速时代的到来,物联网设备也产生了前所未有的海量数据,到2025年,全球的数据量预计将会增至175泽字节(ZB)的数据,对这些数据的集成和挖掘,对社会的发展发挥着重要的作用。集成学习是一种强而有力的技术,可以训练和组合多个基学习器,目的是提高整体的性能,比基学习器拥有更好的泛化能力,而现有的集成学习算法已经无法高效处理如此海量的数据(如随机森林),其中每个基学习器的模型都基于整个数据集进行采样和训练。这样会导致额外的计算成本,在大数据领域是不切实际的。为了获得更高的效率,本文提出了一个分散式集成学习框架,特别地,利用分布式边缘计算来整合集成学习技术。在该框架中,利用网络边缘节点来处理、分析和建立分类和预测模型。一个显然的待研究问题是如何去实现限制每个基学习器访问一个较小的子数据集与实现高精度之间的平衡。本文利用边缘计算系统的模...
【文章来源】:西南大学重庆市 211工程院校 教育部直属院校
【文章页数】:87 页
【学位级别】:硕士
【部分图文】:
论文组织结构图
西南大学硕士学位论文122.1大数据与边缘计算物联网(InternetofThings,简称:IoT)于1999年首次引入社区,用于管理供应链[57]。它通过各种信息传感器设备和技术收集任何需要实时监控、连接和交互的对象或过程[58][59]。云计算是物联网发展的基石,诞生于2005年左右,可以智能处理物联网的海量数据[60]。这海量的大数据表现出高速,多样,大量,价值的特征[61][62],随着5G商业化进程的不断推进和发展,需要在网络边缘部署一个小型或便携式数据中心,使终端请求在本地进行处理,以满足URLLC和mMTC的超低延迟要求[63]。数据量的大小和处理速度是云计算两个无法克服的缺点[64]。在5G通信技术的优势下,边缘计算一度被视为5G时代的下一个口号[65]。边缘计算是指在靠近对象或数据源的一侧集成了网络计算,存储和应用程序核心功能的开放平台,可以在附近提供服务[66],因此,边缘计算又被称为分布式云计算。图2-1显示了传统的云计算架构和边缘计算架构。边缘节点处理完数据后,仅向云端上传有效,准确的数据,以生成更快的网络服务响应,云计算的中心服务器可以访问边缘计算的历史数据。边缘计算位于物理实体的近端,是物理实体与工业之间的连接。因此,边缘计算的体系结构为系统研发带来了很多好处,例如减少数据暴露、较高的数据处理效率、较强的灵活性、较低的数据管理成本等。图2-1传统的云计算架构和边缘计算架构本文利用多agent系统(在2.2章节中介绍)在数据源上的协作和自主能力,让数据源就近处理,选择一些边缘节点来帮助解决大数据中复杂的集成学习问题。
图2-2个体和集成之间的关系
【参考文献】:
期刊论文
[1]K-means聚类算法性能分析与优化研究[J]. 杨柳. 火控雷达技术. 2019(02)
[2]基于Kmeans++聚类的朴素贝叶斯集成方法研究[J]. 钟熙,孙祥娥. 计算机科学. 2019(S1)
[3]聚类算法综述[J]. 章永来,周耀鉴. 计算机应用. 2019(07)
[4]集成学习之随机森林算法综述[J]. 王奕森,夏树涛. 信息通信技术. 2018(01)
[5]半监督集成学习综述[J]. 蔡毅,朱秀芳,孙章丽,陈阿娇. 计算机科学. 2017(S1)
[6]基于弱分类器调整的多分类Adaboost算法[J]. 杨新武,马壮,袁顺. 电子与信息学报. 2016(02)
[7]分类器集成算法研究[J]. 周星,丁立新,万润泽,葛强. 武汉大学学报(理学版). 2015(06)
[8]集成学习中的多样性度量[J]. 孙博,王建东,陈海燕,王寅同. 控制与决策. 2014(03)
[9]AdaBoost算法研究进展与展望[J]. 曹莹,苗启广,刘家辰,高琳. 自动化学报. 2013(06)
[10]数据挖掘中聚类算法研究进展[J]. 周涛,陆惠玲. 计算机工程与应用. 2012(12)
博士论文
[1]聚类集成关键技术研究[D]. 罗会兰.浙江大学 2007
硕士论文
[1]Adaptive Boosting算法及组合分类器的构建研究[D]. 王玲娣.江南大学 2018
[2]随机森林算法的优化改进研究[D]. 马骊.暨南大学 2016
本文编号:3415699
【文章来源】:西南大学重庆市 211工程院校 教育部直属院校
【文章页数】:87 页
【学位级别】:硕士
【部分图文】:
论文组织结构图
西南大学硕士学位论文122.1大数据与边缘计算物联网(InternetofThings,简称:IoT)于1999年首次引入社区,用于管理供应链[57]。它通过各种信息传感器设备和技术收集任何需要实时监控、连接和交互的对象或过程[58][59]。云计算是物联网发展的基石,诞生于2005年左右,可以智能处理物联网的海量数据[60]。这海量的大数据表现出高速,多样,大量,价值的特征[61][62],随着5G商业化进程的不断推进和发展,需要在网络边缘部署一个小型或便携式数据中心,使终端请求在本地进行处理,以满足URLLC和mMTC的超低延迟要求[63]。数据量的大小和处理速度是云计算两个无法克服的缺点[64]。在5G通信技术的优势下,边缘计算一度被视为5G时代的下一个口号[65]。边缘计算是指在靠近对象或数据源的一侧集成了网络计算,存储和应用程序核心功能的开放平台,可以在附近提供服务[66],因此,边缘计算又被称为分布式云计算。图2-1显示了传统的云计算架构和边缘计算架构。边缘节点处理完数据后,仅向云端上传有效,准确的数据,以生成更快的网络服务响应,云计算的中心服务器可以访问边缘计算的历史数据。边缘计算位于物理实体的近端,是物理实体与工业之间的连接。因此,边缘计算的体系结构为系统研发带来了很多好处,例如减少数据暴露、较高的数据处理效率、较强的灵活性、较低的数据管理成本等。图2-1传统的云计算架构和边缘计算架构本文利用多agent系统(在2.2章节中介绍)在数据源上的协作和自主能力,让数据源就近处理,选择一些边缘节点来帮助解决大数据中复杂的集成学习问题。
图2-2个体和集成之间的关系
【参考文献】:
期刊论文
[1]K-means聚类算法性能分析与优化研究[J]. 杨柳. 火控雷达技术. 2019(02)
[2]基于Kmeans++聚类的朴素贝叶斯集成方法研究[J]. 钟熙,孙祥娥. 计算机科学. 2019(S1)
[3]聚类算法综述[J]. 章永来,周耀鉴. 计算机应用. 2019(07)
[4]集成学习之随机森林算法综述[J]. 王奕森,夏树涛. 信息通信技术. 2018(01)
[5]半监督集成学习综述[J]. 蔡毅,朱秀芳,孙章丽,陈阿娇. 计算机科学. 2017(S1)
[6]基于弱分类器调整的多分类Adaboost算法[J]. 杨新武,马壮,袁顺. 电子与信息学报. 2016(02)
[7]分类器集成算法研究[J]. 周星,丁立新,万润泽,葛强. 武汉大学学报(理学版). 2015(06)
[8]集成学习中的多样性度量[J]. 孙博,王建东,陈海燕,王寅同. 控制与决策. 2014(03)
[9]AdaBoost算法研究进展与展望[J]. 曹莹,苗启广,刘家辰,高琳. 自动化学报. 2013(06)
[10]数据挖掘中聚类算法研究进展[J]. 周涛,陆惠玲. 计算机工程与应用. 2012(12)
博士论文
[1]聚类集成关键技术研究[D]. 罗会兰.浙江大学 2007
硕士论文
[1]Adaptive Boosting算法及组合分类器的构建研究[D]. 王玲娣.江南大学 2018
[2]随机森林算法的优化改进研究[D]. 马骊.暨南大学 2016
本文编号:3415699
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3415699.html