当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于Spark的零部件尺寸测量数据聚类分析技术研究

发布时间:2024-04-22 04:24
  零部件的互换性是其生产过程影响甚广的重要性质,其中选配工作就极依赖这个性质,对零部件分组能够显著提升组内的互换性。选配工作是对两种或多种配合零件选择配对,是生产工作中耗时耗力的步骤。一般采用分组选配方案,传统分组是将每种零件按实际测量尺寸形成公差带,根据公差带进行分组。这种分组方法只能适用于单个维度尺寸的分组,本文选用了效果好、依赖少的谱聚类算法对尺寸测量数据进行聚类分组,能够对多维度尺寸数据进行分组,极大提高了零件的互换性。谱聚类是一种不同于k-means等基于质心的传统聚类算法,对数据分布没有过多假设,且多方面评价指标有优势的算法。本文对谱聚类算法进行了两方面的改进,第一利用了堆数据结构快速搜索出每个样本点的k近邻邻域,获得远高于原始基于排序的经典算法的执行效率;第二利用额外的邻域累计信息来去除不可靠的相似连接来提高聚类结果的可靠性和真实性。最后结合以上两个策略形成了新算法HCKNNSC(K-Nearest Neighbor Spectral Clustering algorithm based on Heap and Consensus,基于堆和邻域共识的k近邻谱聚类算法),比起...

【文章页数】:68 页

【学位级别】:硕士

【部分图文】:

图1.1?Hadoop架构??

图1.1?Hadoop架构??

MapReduce是Hadoop的处理组件,是个可扩展、并行处理编程模型和软件框??架,提出了计算向数据移动的新思路减少了数据传输时间[28]。Hadoop、MapReduce、??YARN和Spark的层次依赖、包含、可插拔关系如图1.1所示:??Hadoop?1?Hadoop....


图2.1最小割与规范割结果对比??但这样一来就将问题转化成NP难问题,优化问题又入

图2.1最小割与规范割结果对比??但这样一来就将问题转化成NP难问题,优化问题又入

用简单算法聚类,这也是谱聚类名字的由来。因此,即使在簇呈任意形状时它也能避开??局部最优的陷阱并收敛于全局最优。经典的谱聚类就基于这样的思想,大致的算法流程??如图2.2:??11??


图2.2谱聚类流程图??如流程图2.2所示,先对数据集计算生成距离矩阵Z)加eiT”,这里采用欧式距离??度量每对样本点之间的远近,公式如式(2.5)所不:??d(x,,x)=?lfx^-x)2??

图2.2谱聚类流程图??如流程图2.2所示,先对数据集计算生成距离矩阵Z)加eiT”,这里采用欧式距离??度量每对样本点之间的远近,公式如式(2.5)所不:??d(x,,x)=?lfx^-x)2??

结束??图2.2谱聚类流程图??如流程图2.2所示,先对数据集计算生成距离矩阵Z)加eiT”,这里采用欧式距离??度量每对样本点之间的远近,公式如式(2.5)所不:??d(x,,x;)=?l^fx^-x^)2??h?(2.5)??其中,x,和x,分别是给定数据集女=1,2,中的两....


图2.3相似图近似技术??

图2.3相似图近似技术??

存储和计算限制促使我们想到矩阵稀疏化,将大多数元素清零,这允许使用更少??的存储空间有效地存储稀疏矩阵,而不是存储所有A72个元素。构造相似图有多种不同??方法,现在来讨论最常见的类型。图2.3描绘了多个相似图近似改进的方向,并随后列??举了几种流行的相似图近似方法。??稠密相似....



本文编号:3961925

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3961925.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户fcfe3***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com