分布式半监督学习算法研究
发布时间:2021-04-07 08:52
在大数据时代,随着计算机技术的发展以及硬件水平的提高,获取数据的途径和存储数据的硬件也变得越来越多,这使得我们经常要面临数据由不同节点(站点)分布式地收集和存储的情况。在此场景下,分布式信息处理应运而生。在分布式处理中,各节点能利用本地数据进行局部计算,同时又能与邻居节点进行少量的信息交互。通过这样的方式,各节点能在不直接传递原始数据的情况下,获取了全局的信息,从而实现了完全去中心化而又具有全局意义的信息处理。在机器学习领域,近年来大量的分布式机器学习算法被相继提出。然而,已有的算法大多采用有监督的学习方式,它们通常需要足够多的有标签样本以保证学习的性能。然而,在许多实际应用中,获取大量高质量的有标签数据需要耗费大量的人力物力,因而收集来的数据常常是无标签的或是弱标签的。此外,由于物理或人为的原因,收集来的数据常常存在属性缺失。针对这些情况,本论文系统地开展了分布式场景下的半监督学习研究,以期深度挖掘无标签样本信息,提高分布式学习的性能。本论文主要聚焦于网络化系统中的流数据、多标签数据、样本属性缺失以及带有偏标签数据四种情况开展了系统的研究。我们克服了分布式实现的难点,并提出了相应的分...
【文章来源】:浙江大学浙江省 211工程院校 985工程院校 教育部直属院校
【文章页数】:134 页
【学位级别】:博士
【文章目录】:
致谢
摘要
Abstract
1 绪论
1.1 分布式信息处理
1.2 半监督学习
1.3 本文研究内容和结构安排
2 分布式在线半监督学习
2.1 引言
2.2 预备知识
2.3 面向水平划分的分布式在线半监督支持向量机
2.4 面向垂直划分的分布式在线半监督支持向量机
2.5 仿真实验
2.6 本章小结
3 分布式半监督督多标签学习
3.1 引言
3.2 问题描述
3.3 基于信息论的分布式半监督督多标签学习算法
3.4 性能分析
3.5 仿真实验
3.6 本章小结
4 带缺失失数据的分布式半监督学习
4.1 引言
4.2 问题描述
4.3 基于子空间学习的分布式半监督缺失失数据分类算法
4.4 性能分析
4.5 仿真实验
4.6 本章小结
5 分布式半监督偏标签学习
5.1 引言
5.2 问题描述
5.3 基于平均消歧的分布式半监督偏标签学习算法
5.4 性能分析
5.5 仿真实验
5.6 本章小结
6 总结与展望
参考文献
攻读博士学位期间的研究成果
【参考文献】:
期刊论文
[1]基于自训练EM算法的半监督文本分类[J]. 张博锋,白冰,苏金树. 国防科技大学学报. 2007(06)
博士论文
[1]分布式信息论学习[D]. 沈鹏程.浙江大学 2016
硕士论文
[1]分布式异常检测算法[D]. 苗雪丹.浙江大学 2018
[2]传感器网络中的分布式向量量化[D]. 罗奕梁.浙江大学 2015
本文编号:3123187
【文章来源】:浙江大学浙江省 211工程院校 985工程院校 教育部直属院校
【文章页数】:134 页
【学位级别】:博士
【文章目录】:
致谢
摘要
Abstract
1 绪论
1.1 分布式信息处理
1.2 半监督学习
1.3 本文研究内容和结构安排
2 分布式在线半监督学习
2.1 引言
2.2 预备知识
2.3 面向水平划分的分布式在线半监督支持向量机
2.4 面向垂直划分的分布式在线半监督支持向量机
2.5 仿真实验
2.6 本章小结
3 分布式半监督督多标签学习
3.1 引言
3.2 问题描述
3.3 基于信息论的分布式半监督督多标签学习算法
3.4 性能分析
3.5 仿真实验
3.6 本章小结
4 带缺失失数据的分布式半监督学习
4.1 引言
4.2 问题描述
4.3 基于子空间学习的分布式半监督缺失失数据分类算法
4.4 性能分析
4.5 仿真实验
4.6 本章小结
5 分布式半监督偏标签学习
5.1 引言
5.2 问题描述
5.3 基于平均消歧的分布式半监督偏标签学习算法
5.4 性能分析
5.5 仿真实验
5.6 本章小结
6 总结与展望
参考文献
攻读博士学位期间的研究成果
【参考文献】:
期刊论文
[1]基于自训练EM算法的半监督文本分类[J]. 张博锋,白冰,苏金树. 国防科技大学学报. 2007(06)
博士论文
[1]分布式信息论学习[D]. 沈鹏程.浙江大学 2016
硕士论文
[1]分布式异常检测算法[D]. 苗雪丹.浙江大学 2018
[2]传感器网络中的分布式向量量化[D]. 罗奕梁.浙江大学 2015
本文编号:3123187
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/3123187.html