基于最优传输的高维数据可视化
发布时间:2024-03-20 01:56
随着技术和硬件的进步,数据收集变得更加容易,数据库规模越来越大,复杂性越来越高,人类面临的一大问题就是如何在复杂的高维数据中得到有用的信息。众所众知,人眼能识别的可视化范围也是三维坐标空间系,所以高维数据对人类是陌生的。而解决这一问题的关键就是降维可视化技术。降维可视化技术作为一种将知识具现给人们,却将信息知识的决策权交给人类,是机器学习算法和人类认知和经验有效结合。本文提出了一种新的基于最优质量传输理论的高维数据降维可视化算法,结合了质量驱动的拓扑感知曲线骨架提取算法。本文在该骨架提取算法的基础上进行改进,使其适用于高维数据的骨架提取和指定数量的输出骨架。对于高维数据降维算法,本文将高维和低维的数据抽象为高斯分布的概率矩阵,并采用对称SNE的思想,使概率矩阵的对角相等,避免离群点的惩罚值过大,之后使用Wasserstein距离代替KL散度作为能量函数,并在能量函数之后添加保持全局距离的正则项,使本文的降维算法更加注重于离群点的距离和维持全局的基本形状。本文的可视化方法让降维算法和骨架提取算法互相配合,意图达到让骨架来帮助用户更好的理解分类,同时保证全局距离的降维算法使用户更好理解全局...
【文章页数】:62 页
【学位级别】:硕士
【部分图文】:
本文编号:3932778
【文章页数】:62 页
【学位级别】:硕士
【部分图文】:
图3.1高维数据骨架提取算法流程图
重庆邮电大学硕士学位论文第3章基于最优传输的高维数据可视化241.对原始点集进行随机采样,得到新的采样点集,然后对原始点集进行质量分配,同时保证两个点集的总质量相同。2.基于最优质量传输迭代收缩采样点。每次迭代过程先计算最优传输方案,然后根据最优传输方案将采样点移动到点集质量重心....
图3.2高维数据降维算法流程图
重庆邮电大学硕士学位论文第3章基于最优传输的高维数据可视化29图3.2高维数据降维算法流程图3.3.2对称SNE与SNE相比,对称SNE采用KL散度的发散形式如公式来最小化最小化高维空间中联合概率分布P和低维空间中联合概率分布Q。logijijijijpCKLPQpq(3.5)再....
效果图(b)三维数据点和骨架点可视化
重庆邮电大学硕士学位论文第4章实验结果与分析35Mdcs骨架提取算法后的结果,图中使用的可视化方法是带质量的骨架图和原始数据散点图结合的方式可视化,骨架点越大代表骨架点的质量越大。图4.1(c)是使用本文的基于最优传输的降维算法,降维之后的结果,该图并没有采用图4.1(b)的可视....
图4.1Wolf数据的原始效果和降维之后的效果图
重庆邮电大学硕士学位论文第4章实验结果与分析35Mdcs骨架提取算法后的结果,图中使用的可视化方法是带质量的骨架图和原始数据散点图结合的方式可视化,骨架点越大代表骨架点的质量越大。图4.1(c)是使用本文的基于最优传输的降维算法,降维之后的结果,该图并没有采用图4.1(b)的可视....
本文编号:3932778
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3932778.html
最近更新
教材专著