当前位置:主页 > 理工论文 > 轻工业论文 >

经典葡萄酒数据集的聚类、降维及可视化实证研究

发布时间:2020-06-04 23:31
【摘要】:本文选择经典数据集Wine Data Set(详见2.1)作为研究对象,数据集中包含有三个类别的178个样品数据,每行样品数据包括了13种不同成分的测量值。使用Wine Data Set数据集构造不同维度的数据,再分别使用HC分层聚类、K-means划分聚类、DBSCAN密度聚类、EM模型聚类等四种常用聚类方法对维数逐渐增加的数据集进行聚类分析,对比聚类结果,探究数据维度递增时四种聚类方法的稳健性。为了直观简明地展示和比较各种聚类结果,本文设计了一种“色板”用于比较不同情形下的聚类结果。引入相似度、破碎度和理想度等概念,并在理想度最大的原则下确定各个类的主色调,同时在Excel中采用条件格式快速地根据聚类结果绘制色板,使得各种聚类结果实现了可视化。本文先对t-SNE(t-Distribution Stochastic Neighbor Embedding)降维算法做了必要介绍,随后将四种聚类方法分别与t-SNE降维算法结合使用,对不同维度的数据进行聚类分析,对比降维前后的聚类结果,探究t-SNE算法与四种常用聚类算法结合使用的可行性。
【图文】:

变量数,颜色强度,类黄酮,原花青素


第 2 章 四种常用聚类方法ash(灰分的碱度),Magnesium(镁),Total phenols(总酚),Flavanoids(类黄酮),Nonflavanoid phenols(非黄烷类酚),Proanthocyanins(原花青素),Color intensity(颜色强度),Hue(色调),OD280/OD315 of diluted wines(稀释葡萄酒的 OD280 /OD315),Proline(脯氨酸)

变量数


图 2.1 Malic acid、Ash、Total phenols、Flavanoids 变量数值波动图图 2.2 Nonflavanoid phenols、Proanthocyanins、Hue、OD280/OD315 of diluted wines 变量数值波动图
【学位授予单位】:云南师范大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TS262.6;TP311.13

【相似文献】

相关期刊论文 前10条

1 魏铁华;相似事物的聚类方法[J];成组生产系统;1988年01期

2 盛利元;三次重组聚类方法[J];数学的实践与认识;1988年03期

3 李成智,陈继东,丁瑞云;应用逐步聚类法进行六安地区马尾松苗木分级[J];浙江林业科技;1988年02期

4 蒋佐升;作物育种中三种聚类方法的比较分析[J];湖南农学院学报;1988年01期

5 张力;胡先菊;;模糊目标函数聚类法在种源研究中的应用[J];贵州农学院学报;1988年01期

6 俞世蓉;郭蔼平;;基因型聚类的终止判据[J];生物数学学报;1988年01期

7 张鹄藻;机械零件的包容聚类法[J];成组生产系统;1989年02期

8 华尧楠,华崇钊;Fuzzy综合评估聚类法分区预报二代棉铃虫发生量[J];山东农业科学;1989年04期

9 杨继龙;陈曦;杨伟康;张琼文;;基于谱系聚类法的用户击键特征识别[J];电脑编程技巧与维护;2010年04期

10 郑鹏;李金铭;赖晓燕;赵艳萍;王霞;;主成分分析法与逐步聚类法在树种分类中的应用[J];福建电脑;2006年02期

相关会议论文 前8条

1 钱吴永;党耀国;;基于灰色关联定权的加权聚类法及其应用[A];第19届灰色系统全国会议论文集[C];2010年

2 郭莉;刘鹏熙;林毅;司徒红林;陈前军;;聚类与改良德尔菲法对乳腺癌巩固期证型研究的比较[A];第十一届全国中医及中西医结合乳腺病学术会议论文集[C];2009年

3 许文来;张建强;赵红颖;许宗林;;基于指数法和聚类法的土壤重金属污染评价[A];2008中国环境科学学会学术年会优秀论文集(中卷)[C];2008年

4 邹志;唐建博;;基于USAN原则的昼夜星体检测技术[A];2006年全国光电技术学术交流会会议文集(A 光电系统总体技术专题)[C];2006年

5 孙韫玉;彭祖赠;;一类Fuzzy推理方法及其在预报问题中的应用[A];中国系统工程学会模糊数学与模糊系统委员会第五届年会论文选集[C];1990年

6 冯明权;樊长华;刘丽;龙三;;用聚类法分析岩溶系统的初步探讨[A];西部水利水电开发与岩溶水文地质论文选集[C];2004年

7 饶鲜;李斌;杨绍全;;用核聚类法进行异常检测[A];信号与信息处理技术第三届信号与信息处理全国联合学术会议论文集[C];2004年

8 刘广余;;运用逐步聚类法进行农地适宜性评价[A];中国土地学会1987年学术讨论会论文选集[C];1987年

相关重要报纸文章 前2条

1 河南省公安厅经侦总队 范慧鹏;“指标聚类法”斩获最佳模型应用奖[N];人民公安报;2018年

2 大摩多因子基金经理 张靖;聚类法扩大超额收益空间[N];中国证券报;2012年

相关博士学位论文 前3条

1 周瑞红;基于群智能优化理论的聚类改进方法及应用研究[D];吉林大学;2017年

2 杭文龙;有监督智能聚类与分类技术及其应用研究[D];江南大学;2017年

3 殷瑞飞;数据挖掘中的聚类方法及其应用[D];厦门大学;2008年

相关硕士学位论文 前10条

1 夏典;经典葡萄酒数据集的聚类、降维及可视化实证研究[D];云南师范大学;2019年

2 朱乐为;模糊C-means聚类算法的拓展研究[D];云南师范大学;2019年

3 沈涵生;基于WIFI信号特征的聚类过滤定位算法研究[D];浙江科技学院;2019年

4 卞汛;基于Spark的分布式聚类算法研究及其在社交媒体分析中的应用[D];北京邮电大学;2018年

5 冯崇;基于聚类的雷电临近预报及预测结果呈现研究[D];华中科技大学;2016年

6 孙威;基于膜系统的聚类优化算法研究[D];山东师范大学;2017年

7 李有明;基于空间几何特征的分割聚类法[D];重庆师范大学;2013年

8 孙小新;基于改进谱系聚类法和免疫遗传算法的自适应图像分割方法[D];东北师范大学;2005年

9 胡易;视频中的人脸聚类系统的设计与实现[D];北京邮电大学;2016年

10 沈小虎;Vague集理论在关联规则和聚类分析中的应用研究[D];云南财经大学;2011年



本文编号:2697139

资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/qgylw/2697139.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户427c0***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com