传统的聚类算法仅从单一视角对数据进行分析,并且由于聚类分析缺乏带有语义的类标签,因此得到的聚类划分不具有可解释性。聚类划分的可解释性即聚类划分由决策规则推理得到,并且聚类划分可以被定性和定量地描述。多视角的和可解释的聚类划分将给决策者提供更多地选择空间,并且可以使决策者批判性、改善性和探索性地相信和使用聚类划分。本文针对聚类的多视角性和可解释性问题,提出多视角生成模型的可解释性聚类(Interpretable Clustering with Multi-view Generative model,ICMG)。ICMG能够生成多个视角,并且基于视角得到多个有效的和无冗余的聚类划分,最后通过视角的语义信息对聚类划分进行定性和定量地解释。本文完成的工作如下:(1)构建嵌入多视角因素的贝叶斯案例模型(Muti-view Bayesian Case Model,MBCM)。MBCM是将多视角因素引入到贝叶斯案例模型上的一个生成模型,MBCM可以生成含有多视角因素的数据。(2)构建多视角生成模型(Multi-view Generative Model,MGM)。MGM基于有效原则和无冗余原则使用贝叶斯程序学习(BPL)的组合思想和MBCM生成多个有效的无冗余视角,并使用原型和子空间描述视角。(3)提出多视角生成模型的可解释性聚类(ICMG)。ICMG首先使用MGM得到多个使用原型和子空间描述的视角;然后利用原型和子空间构建规则集,基于规则集进行聚类;最后使用原型和子空间所附带的语义信息定性和定量地解释聚类划分,进而得到有语义的类标签。本文使用多组数据集进行实验,实验结果表明ICMG能够得到多种可解释的聚类划分并且相比于传统聚类算法具有较明显的优势,同时通过聚类划分可解释性的验证实验表明ICMG得到的聚类划分比传统多视角聚类的聚类划分更易理解。
【学位授予单位】:郑州大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP311.13
文章目录
摘要
Abstract
1 绪论
1.1 研究意义与背景
1.2 国内外的研究现状
1.3 本文的主要研究内容
1.4 本文的主要贡献
1.5 论文的结构
1.6 本章小结
2 相关知识
2.1 共轭先验分布
2.2 Gibbs Sampling算法
2.3 基于案例推理的方法
2.4 贝叶斯案例模型
2.5 One-shot学习
2.6 贝叶斯程序学习算法
2.7 多视角聚类
2.8 本章小结
3 多视角生成模型的可解释性聚类
3.1 嵌入多视角因素的贝叶斯案例模型
3.2 多视角生成模型
3.3 多视角生成模型的可解释性聚类的过程
3.4 多视角生成模型的可解释性聚类算法
3.4.1 算法的实现
3.4.2 算法分析
3.4.3 算法的贡献
3.5 定性和定量解释聚类划分的优点
3.6 本章小结
4 实验
4.1 实验数据集
4.2 实验设计
4.3 实验结果及分析
4.3.1 人工数据集的实验结果及分析
4.3.2 三组UCI数据集的实验结果及分析
4.3.3 图像数据集的实验结果及分析
4.4 ICMG算法与其它多视角算法可解释性的对比分析
4.5 聚类划分可解释性的验证
4.6 本章小结
5 总结与下一步工作
5.1 总结
5.2 下一步工作
参考文献
个人简介
致谢
【相似文献】
相关期刊论文 前10条
1 谭显胜;王志明;谭泗桥;袁哲明;熊兴耀;;支持向量回归可解释性体系的建立[J];系统仿真学报;2009年24期
2 王晓兰;曾贤强;王文琰;;一种基于模糊聚类的可解释性建模方法[J];甘肃科学学报;2006年04期
3 阎岭,郑洪涛,蒋静坪;基于进化策略生成可解释性模糊系统[J];电子学报;2005年01期
4 周国亮;宋亚奇;王桂兰;朱永利;;状态监测大数据存储及聚类划分研究[J];电工技术学报;2013年S2期
5 董红召;史彩霞;陈宁;刘冬旭;;基于关联规则的公共自行车调度区域聚类划分[J];科技通报;2013年09期
6 周德云;张X;;空战多目标集群攻击算法研究[J];西北工业大学学报;2009年05期
7 王守强;朱大铭;史士英;;基于最小聚类划分的K-means聚类(1+ε)近似算法[J];计算机研究与发展;2008年S1期
8 刘建刚;唐敦兵;杨春;韩向东;江涛涛;王宁生;;基于物理DSM与行列变换的产品结构聚类划分[J];系统工程与电子技术;2008年10期
9 黄丹;邱旭民;;AMOI管理模式下产品并行开发的产品结构聚类划分研究[J];湖南农机;2014年04期
10 王红军,陈庆新,陈新,郑德涛;基于效用分析的客户聚类方法研究[J];计算机集成制造系统-CIMS;2003年03期
相关硕士学位论文 前4条
1 潘笑颜;多视角生成模型的可解释性聚类研究[D];郑州大学;2017年
2 张佳殨;基于特征选择聚类方法的模糊系统应用与研究[D];江南大学;2016年
3 刘智斌;基于广义熵的加权模糊聚类算法研究[D];河北大学;2012年
4 黄清兰;基于聚类划分的Web日志关联规则增量式挖掘方法研究[D];南昌大学;2013年
本文编号:
1364648
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/1364648.html