学习驱动的概率重构与数据可视化
发布时间:2022-12-17 10:54
在这个信息爆炸的时代,处理与分析大规模的高维数据已经成为数据挖掘与机器学习领域的重大挑战之一。为了获取以及直观理解隐藏在大数据下的潜在信息,一种有效的数据可视化技术是不可或缺的。数据可视化技术能够将复杂的高维数据信息展示在低维的图表上。根据低维的数据图表,我们能够对原始数据的结构信息有一个直观地理解,而且有助于后续的数据探索与模式识别。在一些传统的数据可视化算法的基础上,本文做了如下工作:(1)提出了基于ANNOY的快速近邻搜索算法。该算法在随机投影树的基础上通过近邻拓展的方法进行近邻点的搜索,在保证近邻搜索准确率的基础上大大提升了近邻搜索的速度。(2)提出了基于近邻关系与类别信息的概率重构算法。该算法首先通过近邻拓展的方法构建近邻关系图,然后基于近邻关系与类别信息对原始数据样本之间的相似性进行概率重构。该算法可以更为准确的描述高维数据样本之间的相似关系。(3)提出了基于P-BGLL的可视化算法。该算法在BGLL算法的基础上,使用概率作为空间中样本之间的连接权值,从而提出了P-BGLL算法,并基于P-BGLL算法进行可视化操作。相比于传统的数据可视化算法,基于P-BGLL的数据可视化算...
【文章页数】:105 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 课题的研究背景和意义
1.2 国内外研究的现状
1.2.1 线性降维可视化算法
1.2.2 非线性降维可视化算法
1.2.3 数据可视化的应用
1.2.4 算法小结
1.3 相关工作回顾
1.3.1 聚类算法
1.3.2 复杂网络聚类
1.3.3 卷积神经网络
1.4 主要工作与章节安排
第二章 基于树结构的随机近邻嵌入算法
2.1 基于学生T分布的随机近邻嵌入算法(t-SNE)
2.2 基于树结构的随机近邻嵌入算法(Accelerating t-SNE)
2.2.1 高维空间中概率矩阵的近似求解
2.2.2 基于树结构的梯度优化
2.3 Accelerating t-SNE算法的不足
2.4 本章小结
第三章 基于ANNOY的快速近邻搜索与概率重构算法
3.1 近邻搜索
3.1.1 ANNOY搜索算法
3.1.2 基于ANNOY的快速近邻搜索
3.2 概率重构
3.2.1 基于近邻关系的概率重构
3.2.2 基于类别信息的概率重构
3.2.3 概率重构具体计算方法
3.2.4 概率重构的总结
3.3 算法总结
3.4 本章小结
第四章 基于无监督学习的概率重构与数据可视化
4.1 聚类算法的选择
4.2 P-BGLL聚类算法
4.3 基于P-BGLL的数据可视化算法
4.4 本章小结
第五章 基于有监督学习的概率重构与数据可视化
5.1 特征提取
5.2 Feature-Net
5.2.1 Feature-Net网络
5.2.2 基于分类结果进行概率重构
5.3 基于Feature-Net的数据可视化算法
5.4 本章小结
第六章 实验结果与分析
6.1 实验相关数据集
6.1.1 MNIST数据集
6.1.2 CIFAR-10 数据集
6.1.3 SVHN数据集
6.2 实验设置与评价标准
6.2.1 实验设置
6.2.2 评价标准
6.3 基于ANNOY的快速近邻搜索的实验结果与分析
6.4 P-BGLL算法与BGLL算法的可视化实验结果对比与分析
6.5 基于P-BGLL的可视化算法的实验结果与分析
6.5.1 MNIST数据集实验结果与分析
6.5.2 CIFAR-10 数据集实验结果与分析
6.5.3 SVHN数据集实验结果与分析
6.6 基于Feature-Net的可视化算法的实验结果与分析
6.6.1 MNIST数据集实验结果与分析
6.6.2 CIFAR-10 数据集实验结果与分析
6.6.3 SVHN数据集实验结果与分析
6.6.4 Feature-Net网络与常见网络结构的实验对比与分析
6.7 实验结果总结
6.8 本章小结
第七章 总结与展望
7.1 全文总结
7.2 展望
参考文献
致谢
攻读硕士学位期间已发表或录用的论文
【参考文献】:
期刊论文
[1]基于t-SNE的电力系统电气距离可视化方法研究[J]. 史东宇,胡文强,李刚,严剑峰,臧德春. 电力工程技术. 2018(02)
[2]DEEPEYE: An Automatic Big Data Visualization Framework[J]. Xuedi Qin,Yuyu Luo,Nan Tang,Guoliang Li. Big Data Mining and Analytics. 2018(01)
[3]大数据可视分析综述[J]. 任磊,杜一,马帅,张小龙,戴国忠. 软件学报. 2014(09)
[4]复杂网络中的社团结构算法综述[J]. 汪小帆,刘亚冰. 电子科技大学学报. 2009(05)
本文编号:3719801
【文章页数】:105 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 课题的研究背景和意义
1.2 国内外研究的现状
1.2.1 线性降维可视化算法
1.2.2 非线性降维可视化算法
1.2.3 数据可视化的应用
1.2.4 算法小结
1.3 相关工作回顾
1.3.1 聚类算法
1.3.2 复杂网络聚类
1.3.3 卷积神经网络
1.4 主要工作与章节安排
第二章 基于树结构的随机近邻嵌入算法
2.1 基于学生T分布的随机近邻嵌入算法(t-SNE)
2.2 基于树结构的随机近邻嵌入算法(Accelerating t-SNE)
2.2.1 高维空间中概率矩阵的近似求解
2.2.2 基于树结构的梯度优化
2.3 Accelerating t-SNE算法的不足
2.4 本章小结
第三章 基于ANNOY的快速近邻搜索与概率重构算法
3.1 近邻搜索
3.1.1 ANNOY搜索算法
3.1.2 基于ANNOY的快速近邻搜索
3.2 概率重构
3.2.1 基于近邻关系的概率重构
3.2.2 基于类别信息的概率重构
3.2.3 概率重构具体计算方法
3.2.4 概率重构的总结
3.3 算法总结
3.4 本章小结
第四章 基于无监督学习的概率重构与数据可视化
4.1 聚类算法的选择
4.2 P-BGLL聚类算法
4.3 基于P-BGLL的数据可视化算法
4.4 本章小结
第五章 基于有监督学习的概率重构与数据可视化
5.1 特征提取
5.2 Feature-Net
5.2.1 Feature-Net网络
5.2.2 基于分类结果进行概率重构
5.3 基于Feature-Net的数据可视化算法
5.4 本章小结
第六章 实验结果与分析
6.1 实验相关数据集
6.1.1 MNIST数据集
6.1.2 CIFAR-10 数据集
6.1.3 SVHN数据集
6.2 实验设置与评价标准
6.2.1 实验设置
6.2.2 评价标准
6.3 基于ANNOY的快速近邻搜索的实验结果与分析
6.4 P-BGLL算法与BGLL算法的可视化实验结果对比与分析
6.5 基于P-BGLL的可视化算法的实验结果与分析
6.5.1 MNIST数据集实验结果与分析
6.5.2 CIFAR-10 数据集实验结果与分析
6.5.3 SVHN数据集实验结果与分析
6.6 基于Feature-Net的可视化算法的实验结果与分析
6.6.1 MNIST数据集实验结果与分析
6.6.2 CIFAR-10 数据集实验结果与分析
6.6.3 SVHN数据集实验结果与分析
6.6.4 Feature-Net网络与常见网络结构的实验对比与分析
6.7 实验结果总结
6.8 本章小结
第七章 总结与展望
7.1 全文总结
7.2 展望
参考文献
致谢
攻读硕士学位期间已发表或录用的论文
【参考文献】:
期刊论文
[1]基于t-SNE的电力系统电气距离可视化方法研究[J]. 史东宇,胡文强,李刚,严剑峰,臧德春. 电力工程技术. 2018(02)
[2]DEEPEYE: An Automatic Big Data Visualization Framework[J]. Xuedi Qin,Yuyu Luo,Nan Tang,Guoliang Li. Big Data Mining and Analytics. 2018(01)
[3]大数据可视分析综述[J]. 任磊,杜一,马帅,张小龙,戴国忠. 软件学报. 2014(09)
[4]复杂网络中的社团结构算法综述[J]. 汪小帆,刘亚冰. 电子科技大学学报. 2009(05)
本文编号:3719801
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3719801.html