基于Spark的零部件尺寸测量数据聚类分析技术研究
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
图1.1?Hadoop架构??
MapReduce是Hadoop的处理组件,是个可扩展、并行处理编程模型和软件框??架,提出了计算向数据移动的新思路减少了数据传输时间[28]。Hadoop、MapReduce、??YARN和Spark的层次依赖、包含、可插拔关系如图1.1所示:??Hadoop?1?Hadoop....
图2.1最小割与规范割结果对比??但这样一来就将问题转化成NP难问题,优化问题又入
用简单算法聚类,这也是谱聚类名字的由来。因此,即使在簇呈任意形状时它也能避开??局部最优的陷阱并收敛于全局最优。经典的谱聚类就基于这样的思想,大致的算法流程??如图2.2:??11??
图2.2谱聚类流程图??如流程图2.2所示,先对数据集计算生成距离矩阵Z)加eiT”,这里采用欧式距离??度量每对样本点之间的远近,公式如式(2.5)所不:??d(x,,x)=?lfx^-x)2??
结束??图2.2谱聚类流程图??如流程图2.2所示,先对数据集计算生成距离矩阵Z)加eiT”,这里采用欧式距离??度量每对样本点之间的远近,公式如式(2.5)所不:??d(x,,x;)=?l^fx^-x^)2??h?(2.5)??其中,x,和x,分别是给定数据集女=1,2,中的两....
图2.3相似图近似技术??
存储和计算限制促使我们想到矩阵稀疏化,将大多数元素清零,这允许使用更少??的存储空间有效地存储稀疏矩阵,而不是存储所有A72个元素。构造相似图有多种不同??方法,现在来讨论最常见的类型。图2.3描绘了多个相似图近似改进的方向,并随后列??举了几种流行的相似图近似方法。??稠密相似....
本文编号:3961925
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3961925.html