数据驱动的产业集群广义制造系统的产品综合评价方法研究
发布时间:2021-02-20 07:13
随着我国工业化进程的推进,产业集群成为了中国经济发展的一个重要特征,集群成员之间建立了长期稳定又不乏激烈竞争的协作关系,在促进区域经济发展中发挥着越来越重要的作用。本文将产业集群看成一个为客户群提供多样化产品、满足客户个性化需求、具有动态灵活以及广泛协同的业务组织模式。随着经济的快速发展,人们生活水平不断提高,消费者对产品的需求越来越高,从大众化、批量化逐渐向差异化、个性化、和多样化发展。产品更新换代的周期不断缩短,对市场快速响应能力要求越来越高。产品综合评价对于制造业来说非常重要,是进行产品优化更新的重要依据,然而评价信息的获取和科学的评价模型是进行产品优化更新的最大障碍。在集群广义制造系统中拥有丰富的集群数据可以利用,从冗杂的集群产品数据中挖掘有用的信息进而转化为知识并提供知识服务成为了重要的研究内容。本文针对产品综合评价中的信息获取及评价方法问题,以文本挖掘技术为基础,运用情感倾向分析技术和LDA主题模型算法进行主题发现的研究,并将主题发现的结果应用于产品评价的知识服务当中,构建了数据驱动的产业集群广义制造系统的产品综合评价模型,丰富原有的产品评价手段和评价方法。数据驱动的产品评...
【文章来源】:宁波大学浙江省
【文章页数】:78 页
【学位级别】:硕士
【部分图文】:
产业集群广义制造系统概念模型
36不太准确。比如“雷军公司上市了”和“小米会不会涨价”,从字面上理解这两个简单的句子表达的意思是没有任何联系,所以按传统方法来计算其相似度会很低,但是,结合情境,都知道这两个句子是由一定相关性的。为此,LDA主题模型是较为有效的一种结合了文档语义的文本挖掘算法。LDA主题模型由Blei等人于2003年提出,它是一种典型的词袋模型(BagofWords,BOW),该模型具有三层结构,即文档(D)、主题(Z)、词项(W),能够有效地对文本进行建模,和传统的向量空间模型(VSM)相比,增加了概率的信息。一片文档由若干词项组成且可以包含多个主题,每个主题下都有组成主题词表的词,将文本信息转化为易于建模的数字信息为:D=(W1,W2,…,WN),C={D1,D2,…,DM},z={Z1,Z2,…,Zk}。其中N表示N个词项;M表示M篇文档;C表示语料集;k表示主题个数;z表示潜在的主题词表。LDA对文本信息的主题建模如图3.8所示,其中,是语料级别的狄利克雷函数的先验参数,对任意一个文档而言,只采样一次,一般设置为经验值。其中,变小,是尽可能让同一个文档只有一个主题,变小,是让一个词尽可能属于同一个主题。是文档级别的变量,每个文档对应一个,也就是每个文档产生各个主题Z的概率是不同的,因此生成每个文档采样一次。图3.8LDA对文本信息的主题建模Fig.3.8ThememodelingofLDAfortextinformation
42理的R语言部分代码如图4.1所示。经过数据清理层各个部分的清理工作后,抽取出有价值的产品评论语料,共计有9853条语料。图4.1数据清理R语言部分代码Fig.4.1Rlanguagecodeofdatacleaning4.3数据挖掘分析(1)产品特征提取对全系列的产品评论语料进行文本数据处理,对词性进行识别,再对产品全系列评论语料库进行LDA主题分析并进行词频统计,根据不同主题的情况提取相关的特征词,iF={无人机,电池,包装,信号,飞行,遥控器,质量,北京,物流,降价,返航,拍摄,飞行器,炸机,禁飞区,配件,发货,续航,拍照,电量,遥控,云台,配送,性价比,快递,...}。结合无人机的用户手册说明,抽取自身产品特征jF={GPS,信号,天线,螺旋桨,电机,起落架,电池,遥控器,云台,相机,视觉定位系统,充电器},最终产品特征集合为ijFFF,在求并集的时候将代表一个意思的词汇进行合并,比如ijF={电池,续航,电量}={电池}。最后得到F={GPS,信号,天线,螺旋桨,电机,起落架,电池,遥控器,云台,相机,视觉定位系统,充电器,无人机,包装,飞行,质量,北京,物流,降价,飞行器,炸机,禁飞区,配件,性价比,...}。此外,编写R语言程序用以绘制产品评论的词云,通过绘制的词云图可以直观地看出消费者大致关注的产品的特征有哪些,如图4.2所示,字体越大
【参考文献】:
期刊论文
[1]基于Hadoop的医疗大数据智能辅助诊疗平台的构建[J]. 曾航齐,黄桂新,伍君贤,张武军. 中国数字医学. 2018(09)
[2]基于大数据智能的竞争情报系统模型研究[J]. 唐晓波,郑杜,翟夏普. 情报理论与实践. 2018(11)
[3]基于产品形态美度的评价模型及应用[J]. 苏建宁,李明,周爱民,张书涛. 兰州理工大学学报. 2018(02)
[4]融合多源数据的智能配用电多时间尺度数据分析技术[J]. 刘广一,周建其. 供用电. 2018(03)
[5]产业集群创新网络中创新能力传递障碍与集群升级研究[J]. 赫连志巍,王岚. 科技进步与对策. 2018(03)
[6]基于产品评论的消费者情感波动分析模型构建及实证研究[J]. 林园园,战洪飞,余军合,李长江,张凡. 现代图书情报技术. 2016(11)
[7]地理邻近、认知邻近对省际边界区域经济协同发展影响机制研究——基于对中三角、长三角省际边界区域的实证[J]. 李琳,曾巍. 华东经济管理. 2016(05)
[8]大数据在肿瘤预后预测中的应用现状和前景[J]. 刘文扬,金晶. 科学通报. 2015(30)
[9]基于生态进化理论的产业集群动态演化模型构建[J]. 周婷. 统计与决策. 2015(12)
[10]智慧交通中的大数据应用研究[J]. 王雅琼,杨云鹏,樊重俊. 物流工程与管理. 2015(05)
博士论文
[1]基于复杂社会网络的资源型企业绿色行为扩散机制研究[D]. 郝祖涛.中国地质大学 2014
[2]不确定环境下集群创新网络合作度、开放度与集群增长绩效的关系研究[D]. 王松.浙江工商大学 2013
硕士论文
[1]产品个性化需求转换与模块化设计评价研究及应用[D]. 王玉豪.浙江大学 2018
[2]多功能包装机设计质量综合评价系统研究[D]. 刘祎.中北大学 2016
[3]文本情感分析在产品评论中的应用研究[D]. 魏慧玲.北京交通大学 2014
本文编号:3042429
【文章来源】:宁波大学浙江省
【文章页数】:78 页
【学位级别】:硕士
【部分图文】:
产业集群广义制造系统概念模型
36不太准确。比如“雷军公司上市了”和“小米会不会涨价”,从字面上理解这两个简单的句子表达的意思是没有任何联系,所以按传统方法来计算其相似度会很低,但是,结合情境,都知道这两个句子是由一定相关性的。为此,LDA主题模型是较为有效的一种结合了文档语义的文本挖掘算法。LDA主题模型由Blei等人于2003年提出,它是一种典型的词袋模型(BagofWords,BOW),该模型具有三层结构,即文档(D)、主题(Z)、词项(W),能够有效地对文本进行建模,和传统的向量空间模型(VSM)相比,增加了概率的信息。一片文档由若干词项组成且可以包含多个主题,每个主题下都有组成主题词表的词,将文本信息转化为易于建模的数字信息为:D=(W1,W2,…,WN),C={D1,D2,…,DM},z={Z1,Z2,…,Zk}。其中N表示N个词项;M表示M篇文档;C表示语料集;k表示主题个数;z表示潜在的主题词表。LDA对文本信息的主题建模如图3.8所示,其中,是语料级别的狄利克雷函数的先验参数,对任意一个文档而言,只采样一次,一般设置为经验值。其中,变小,是尽可能让同一个文档只有一个主题,变小,是让一个词尽可能属于同一个主题。是文档级别的变量,每个文档对应一个,也就是每个文档产生各个主题Z的概率是不同的,因此生成每个文档采样一次。图3.8LDA对文本信息的主题建模Fig.3.8ThememodelingofLDAfortextinformation
42理的R语言部分代码如图4.1所示。经过数据清理层各个部分的清理工作后,抽取出有价值的产品评论语料,共计有9853条语料。图4.1数据清理R语言部分代码Fig.4.1Rlanguagecodeofdatacleaning4.3数据挖掘分析(1)产品特征提取对全系列的产品评论语料进行文本数据处理,对词性进行识别,再对产品全系列评论语料库进行LDA主题分析并进行词频统计,根据不同主题的情况提取相关的特征词,iF={无人机,电池,包装,信号,飞行,遥控器,质量,北京,物流,降价,返航,拍摄,飞行器,炸机,禁飞区,配件,发货,续航,拍照,电量,遥控,云台,配送,性价比,快递,...}。结合无人机的用户手册说明,抽取自身产品特征jF={GPS,信号,天线,螺旋桨,电机,起落架,电池,遥控器,云台,相机,视觉定位系统,充电器},最终产品特征集合为ijFFF,在求并集的时候将代表一个意思的词汇进行合并,比如ijF={电池,续航,电量}={电池}。最后得到F={GPS,信号,天线,螺旋桨,电机,起落架,电池,遥控器,云台,相机,视觉定位系统,充电器,无人机,包装,飞行,质量,北京,物流,降价,飞行器,炸机,禁飞区,配件,性价比,...}。此外,编写R语言程序用以绘制产品评论的词云,通过绘制的词云图可以直观地看出消费者大致关注的产品的特征有哪些,如图4.2所示,字体越大
【参考文献】:
期刊论文
[1]基于Hadoop的医疗大数据智能辅助诊疗平台的构建[J]. 曾航齐,黄桂新,伍君贤,张武军. 中国数字医学. 2018(09)
[2]基于大数据智能的竞争情报系统模型研究[J]. 唐晓波,郑杜,翟夏普. 情报理论与实践. 2018(11)
[3]基于产品形态美度的评价模型及应用[J]. 苏建宁,李明,周爱民,张书涛. 兰州理工大学学报. 2018(02)
[4]融合多源数据的智能配用电多时间尺度数据分析技术[J]. 刘广一,周建其. 供用电. 2018(03)
[5]产业集群创新网络中创新能力传递障碍与集群升级研究[J]. 赫连志巍,王岚. 科技进步与对策. 2018(03)
[6]基于产品评论的消费者情感波动分析模型构建及实证研究[J]. 林园园,战洪飞,余军合,李长江,张凡. 现代图书情报技术. 2016(11)
[7]地理邻近、认知邻近对省际边界区域经济协同发展影响机制研究——基于对中三角、长三角省际边界区域的实证[J]. 李琳,曾巍. 华东经济管理. 2016(05)
[8]大数据在肿瘤预后预测中的应用现状和前景[J]. 刘文扬,金晶. 科学通报. 2015(30)
[9]基于生态进化理论的产业集群动态演化模型构建[J]. 周婷. 统计与决策. 2015(12)
[10]智慧交通中的大数据应用研究[J]. 王雅琼,杨云鹏,樊重俊. 物流工程与管理. 2015(05)
博士论文
[1]基于复杂社会网络的资源型企业绿色行为扩散机制研究[D]. 郝祖涛.中国地质大学 2014
[2]不确定环境下集群创新网络合作度、开放度与集群增长绩效的关系研究[D]. 王松.浙江工商大学 2013
硕士论文
[1]产品个性化需求转换与模块化设计评价研究及应用[D]. 王玉豪.浙江大学 2018
[2]多功能包装机设计质量综合评价系统研究[D]. 刘祎.中北大学 2016
[3]文本情感分析在产品评论中的应用研究[D]. 魏慧玲.北京交通大学 2014
本文编号:3042429
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3042429.html