概念格构造算法改进
发布时间:2020-08-24 08:36
【摘要】:概念格构造问题起源于哲学,如今已广泛应用于实际生产中,是对事物的共同本质特点进行抽取,加以概括,形成概念,并最终建立起概念之间相互关系的格状结构,即本文改进算法所要解决的问题。本文的研究目的是建立一个比目前的算法在时间和空间上实现双重压缩的概念格构造算法。首先按照批处理型、渐进构造型、并行构造型和模糊构造型对现阶段的构造算法进行了分类,并在每一类中挑选若干具有代表性的算法进行优缺点的分析,最终选择批处理型中的Chein算法作为本文改进算法的基础。Chein算法具备不依赖于形式背景的优势,且新概念的生成过程和概念之间层次关系的构造相互独立。因此提出了划分子形式背景的方式将新概念的生成过程根据交运算的左值进行子形式背景的划分,正文中给出了证明。从而相互独立的计算即可实现并行化。经过大量实验证明采用FP-Tree对概念进行存储不仅可以实现更高比例的存储空间压缩,同时极大优化了概念之间的交运算过程,效果明显优于其它算法所采用的位运算方式。本文另一个重要改进点是借助FP-Tree实现了冗余概念提早发现并直接删除,从子形式背景划分阶段就避免了冗余概念的产生,从而解决冗余概念对空间的浪费,正文中给出了详细证明。最后通过领域内通用的标准UCI数据集与其它算法进行了多维度对比,验证了改进算法的正确性和高性能的可行性,同时通过转置数据说明了批处理型算法相比于渐进构造型算法具备更好的实用性。正文也给出了实验数据,方便其它改进者进行算法类比。
【学位授予单位】:华南理工大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP301.6;TP311.5
【图文】:
图5.邋1对象数目对时间的影响逡逑数据转置前后时间提升十分明显
0逦1000逦2000逦3000逦4000逦5000逦6000逦7000逦8000逦9000逡逑对象维度逡逑图5.邋1对象数目对时间的影响逡逑数据转置前后时间提升十分明显。逡逑表5.2转置后实验对比逡逑对象数目逡逑100逦200逦500逦1000逦2000逦5000逦8124逡逑耗时逡逑My邋Algorithm逦—10逦10逦20逦40逦60逦165逦210 ̄逡逑InClose2逦10逦20逦30逦IT0逦220逦650逦920 ̄逡逑1000逡逑900逦少,"逡逑800逡逑700逡逑^邋600逦X逡逑^逦z逡逑^邋500逦Z逡逑^逦1邋?邋My邋Algorithm逡逑400逦Z逡逑■邋1邋lnClose2逡逑300逡逑200邋^邋逦逦逡逑0逦1000邋2000邋3000邋4000邋5000邋6000
对象的交集,即FP-Tree中的公共前缀。而算法只需要计算非公共部分的节点之间的交逡逑运算,囡此计算量得到了极太的降低。算法的执行效率也得到了极大的提升^逡逑对于转置后的数据,我们进行进一步的对比,将图5.1与图5.2绘制在同一张曲线逡逑图中进行对比,如图5.3所示。逡逑1000逡逑900逡逑800逡逑700逡逑^邋600逡逑—500逦lnClose2逡逑宕400逦转置前逡逑300逦转置后逡逑200逡逑二逡逑0逦1000逦2000逦3000逦4000逦5000逦6000逦7000逦8000逦9000逡逑对象维度逡逑图5.3转置前后算t去时间对比图逡逑通过图5.3对下述的两个问题进行分析。首先,转置对批处理算法的影响较大,因逡逑为My邋Algorithm算法在建立FP-Tree时索引的选取决定了算法g_多压缩的计栜羹,由于逡逑Mushroom(8,124x125)数据集的对象较多,属性较少,因此表5.1中选择属性集作为逡逑FP-Tree的索引时数据的压缩并不明显,因此大量对象需要进行概念之间的交运算.s虽逡逑然属性的交运算在FP-Tree优化下己经只进行非公共部分属性的交运算,但由于对象集逡逑基数较大,因此较高的计算量仍然无法被忽略。逡逑对比转置前后的数据
本文编号:2802236
【学位授予单位】:华南理工大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP301.6;TP311.5
【图文】:
图5.邋1对象数目对时间的影响逡逑数据转置前后时间提升十分明显
0逦1000逦2000逦3000逦4000逦5000逦6000逦7000逦8000逦9000逡逑对象维度逡逑图5.邋1对象数目对时间的影响逡逑数据转置前后时间提升十分明显。逡逑表5.2转置后实验对比逡逑对象数目逡逑100逦200逦500逦1000逦2000逦5000逦8124逡逑耗时逡逑My邋Algorithm逦—10逦10逦20逦40逦60逦165逦210 ̄逡逑InClose2逦10逦20逦30逦IT0逦220逦650逦920 ̄逡逑1000逡逑900逦少,"逡逑800逡逑700逡逑^邋600逦X逡逑^逦z逡逑^邋500逦Z逡逑^逦1邋?邋My邋Algorithm逡逑400逦Z逡逑■邋1邋lnClose2逡逑300逡逑200邋^邋逦逦逡逑0逦1000邋2000邋3000邋4000邋5000邋6000
对象的交集,即FP-Tree中的公共前缀。而算法只需要计算非公共部分的节点之间的交逡逑运算,囡此计算量得到了极太的降低。算法的执行效率也得到了极大的提升^逡逑对于转置后的数据,我们进行进一步的对比,将图5.1与图5.2绘制在同一张曲线逡逑图中进行对比,如图5.3所示。逡逑1000逡逑900逡逑800逡逑700逡逑^邋600逡逑—500逦lnClose2逡逑宕400逦转置前逡逑300逦转置后逡逑200逡逑二逡逑0逦1000逦2000逦3000逦4000逦5000逦6000逦7000逦8000逦9000逡逑对象维度逡逑图5.3转置前后算t去时间对比图逡逑通过图5.3对下述的两个问题进行分析。首先,转置对批处理算法的影响较大,因逡逑为My邋Algorithm算法在建立FP-Tree时索引的选取决定了算法g_多压缩的计栜羹,由于逡逑Mushroom(8,124x125)数据集的对象较多,属性较少,因此表5.1中选择属性集作为逡逑FP-Tree的索引时数据的压缩并不明显,因此大量对象需要进行概念之间的交运算.s虽逡逑然属性的交运算在FP-Tree优化下己经只进行非公共部分属性的交运算,但由于对象集逡逑基数较大,因此较高的计算量仍然无法被忽略。逡逑对比转置前后的数据
【参考文献】
相关期刊论文 前2条
1 崔芳婷;王黎明;张卓;;基于约束的模糊概念格构造算法[J];计算机科学;2015年08期
2 谢志鹏,刘宗田;概念格的快速渐进式构造算法[J];计算机学报;2002年05期
相关硕士学位论文 前3条
1 杨建峰;多值概念格和区间值概念格构造及属性约简[D];西北大学;2012年
2 刘冬;区间值信息系统上概念格的属性约简方法[D];长安大学;2012年
3 纪彤坤;概念格Chein算法的研究与改进[D];华南理工大学;2012年
本文编号:2802236
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2802236.html