面向生产制造的大数据分析平台技术研究
本文关键词: 大数据平台 分布式并行化 STKmeans 不均衡数据 出处:《山东大学》2017年硕士论文 论文类型:学位论文
【摘要】:随着大数据技术逐渐成为工业4.0的标配技术之一,生产制造企业迈入了智能制造时代,基于数据的生产和管理需求越来越高。由于基于物联网技术的数据采集和控制模块的广泛应用,形成了极为庞大的数据源,传统数据库技术对这种大规模的数据的存储、管理以及分析能力显得捉襟见肘。而利用大数据技术,可以给企业提供高效的数据分析能力,提高质量管控、工艺提升、服务升级等方面的管理和决策能力。为解决生产制造企业无法通过传统数据分析方法从企业大数据中获取有价值信息的痛点,本文实现了一套大数据分析解决方案并进行了实例分析。首先介绍了平台的基础架构,然后针对大数据平台核心功能模块如数据获取、大数据分析模块、平台可视化等模块进行了详细设计,尤其针对大数据平台的运行特点以KNN为例对分析模块给出了分布式并行化的实现思路。针对某生产制造企业具体的业务需求,分别给出了大数据平台支撑下的数据预处理、特征提取、聚类模型及算法设计和实现,结合企业拧紧工艺的数据分析案例进行了详细阐述。在此过程中,针对该企业数据特征,提出了一种改进的针对大规模不均衡数据的聚类分析算法—STKmeans(Second Time Kmeans),企业数据的分析结果证明了其聚类效果远远高于传统聚类方法,同时验证了平台的实用性。
[Abstract]:With big data technology becoming one of the standard technologies in industry 4.0, manufacturing enterprises have entered the era of intelligent manufacturing. Because of the wide application of data acquisition and control module based on the Internet of things, a huge data source has been formed, and the traditional database technology stores this kind of large-scale data. The ability of management and analysis is overstretched. By using big data technology, we can provide efficient data analysis ability, improve quality control, and improve technology. In order to solve the problem that manufacturing enterprises can not obtain valuable information from big data through traditional data analysis, This paper has realized a set of big data analysis solution and carried on the example analysis. First, introduced the platform infrastructure, then aimed at the big data platform core function module such as the data acquisition, the big data analysis module, The platform visualization module is designed in detail, especially according to the running characteristics of big data platform, taking KNN as an example, the realization of distributed parallelization is given. The data preprocessing, feature extraction, clustering model and algorithm design and implementation based on big data platform are presented, and the data analysis cases of enterprise tightening process are described in detail. This paper presents an improved clustering algorithm for large scale unbalanced data-STKmeans second Time Kmeansan. The results of enterprise data analysis show that the clustering effect of this algorithm is much higher than that of the traditional clustering method, and the practicability of the platform is verified at the same time.
【学位授予单位】:山东大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP311.13
【相似文献】
相关期刊论文 前10条
1 得州;;挖出不一样的秘密 数据分析师[J];电脑爱好者;2010年13期
2 张文霖;;数据分析初体验[J];数据;2013年05期
3 古福;;让大数据分析更快速、更简化[J];互联网周刊;2013年11期
4 于宗民;;数据分析应用的最大障碍[J];中国金融电脑;2007年08期
5 魏巍巍;;论数据分析在企业经营管理中的重要性[J];产业与科技论坛;2012年12期
6 张文霖;;数据分析六步曲[J];数据;2013年06期
7 戴未琰;;大数据分析概要[J];物联网技术;2013年08期
8 王海蕴;;大数据分析 市场成倍增长 深耕空间巨大[J];财经界;2013年10期
9 ;大数据分析系列3:大数据分析如何权衡存储[J];电脑与电信;2013年10期
10 马_";;对大数据分析相关问题的思考[J];信息通信技术;2013年06期
相关会议论文 前10条
1 申敏;;数据分析的原则和一般方法[A];2010年云南电力技术论坛论文集(文摘部分)[C];2010年
2 刘刚;;小学生数据分析观念的培养[A];中华教育理论与实践科研论文成果选编(第五卷)[C];2013年
3 石勇;;在银行和金融数据分析中的评分方法[A];Data Analysis, Econo-physics and Risk Management--Proceedings of CCAST (World Laboratory) Workshop[C];2001年
4 吴一平;;基于数据分析的离校工作改进[A];中国高等教育学会教育信息化分会第十二次学术年会论文集[C];2014年
5 吕大青;;送变电施工企业中数据分析的运用[A];第二届浙江中西部科技论坛论文集(第一卷)[C];2005年
6 李小花;李姝;;大数据分析在指挥信息系统中的应用[A];2014第二届中国指挥控制大会论文集(下)[C];2014年
7 范丽伟;唐焕文;唐一源;;空间独立成分分析在fMRⅠ数据分析中的应用[A];第九次全国生物物理大会学术会议论文摘要集[C];2002年
8 张军;李婕;;中国国民休闲状态变化研究——基于网上数据分析[A];第十五届全国区域旅游学术开发研讨会暨度假旅游论坛论文册[C];2010年
9 徐小龙;王汝传;姜波;;一种新的基于P2P的电信海量数据分析业务模式[A];普适计算及其软件新技术——第三届长三角计算机科技论坛文集[C];2006年
10 邵东华;;高速公路的平面控制复测与数据分析[A];第四届“测绘科学前沿技术论坛”论文精选[C];2012年
相关重要报纸文章 前10条
1 匿铭;数据分析的“磨刀阶段”[N];中华读书报;2013年
2 胡英;澳发布政府可信数据分析指导草案[N];人民邮电;2014年
3 郑爱民;陕西加强消费维权数据分析利用[N];中国工商报;2014年
4 本报驻美国记者 吴成良;“数据分析”成了“金饭碗”[N];人民日报;2014年
5 本报记者 杨群;大数据分析亮出专家的“自贸研判”[N];解放日报;2014年
6 周桂生 汤建国;数据分析行业登陆湖南,带来巨大商机[N];中国企业报;2008年
7 朱文明 甫瀚公司咨询专家;数据分析提升决策智慧[N];中国审计报;2009年
8 ;国采中心空调协议供货数据分析[N];政府采购信息报;2010年
9 武虹 审计署驻沈阳特派办;以数据分析为统领开展数字化审计工作[N];中国审计报;2012年
10 杰弗尼;行走在大数据分析误区旁的零售商[N];中国商报;2013年
相关博士学位论文 前7条
1 刘岳;区域地球化学数据分析及成矿信息融合模型研究[D];中国地质大学;2015年
2 徐晓琳;面向大规模数据分析与分类的正则化回归算法[D];安徽大学;2017年
3 董媛香;基于软集合的不完备不一致数据分析及决策方法研究[D];重庆大学;2014年
4 张睿;数据分析在污染控制领域的节能优化应用[D];中国科学技术大学;2014年
5 陈宜治;函数型数据分析若干方法及应用[D];浙江工商大学;2011年
6 郭广报;基于并行统计计算的金融数据分析[D];山东大学;2012年
7 孙建强;生物磁共振数据分析中的几个问题[D];中国科学院研究生院(武汉物理与数学研究所);2014年
相关硕士学位论文 前10条
1 周儒军;基于Hadoop的分布式监控平台的研究与实现[D];华南理工大学;2015年
2 施建辉;中职生职业道德认识现状调查研究[D];上海师范大学;2015年
3 丁国辉;核磁共振数据分析中的两个问题[D];中国科学院研究生院(武汉物理与数学研究所);2015年
4 张清;面向精准广告投放的数据分析与可视化系统设计与实现[D];山东大学;2015年
5 周徐;基于分层采样的DeepWeb数据分析方法研究[D];苏州大学;2015年
6 王佳琦;纠正性反馈对高中生英语冠词习得的影响[D];内蒙古师范大学;2015年
7 顾星竹;基于Hadoop的PCF系统的设计与实现[D];南京大学;2014年
8 张海洋;大数据的统计分析技术比较研究[D];南京大学;2014年
9 扎娟娟;银保通管理系统的构建与实施[D];电子科技大学;2014年
10 关晨静;高中生英语跨文化交际能力的调查研究[D];江西师范大学;2015年
,本文编号:1551600
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/1551600.html