基于类别特征表示边界域处理的三支决策模型研究

发布时间:2021-01-09 15:14
  在“爆炸式”的大数据时代,实际生活中所产生的数据往往都具有质量偏低的特点,尤其在进行数据决策处理时,会产生很多不确定性问题。因此,在大数据和人工智能背景下,如何挖掘有效信息并正确处理这些不确定数据是当下数据研究者们的重要研究方向之一。针对该问题,相继出现了很多处理相关问题的方法和理论,其中三支决策理论(Three-way decision theory)是处理不确定性问题的热门研究方法之一。三支决策的核心思想是将确定样本划分到对应的正域、负域,同时将不确定样本暂时划分到边界域中。针对传统二支决策理论在数据分类过程中只进行“接受”和“拒绝”的情况,三支决策为不确定数据增加了第三种决策选择,分类决策结果不再只有“接受”与“拒绝”两个选择,而是对这部分数据进行延迟决策。也就是当数据信息不足以支持进行接受决策或者拒绝决策时,则被暂时划分到边界域中,采取延迟决策,待后续挖掘更多合适信息时,再做进一步决策处理。因此,在数据决策过程中,三支决策理论可以有效的处理明确与不明确样本,并且可以很好解决具有不确定信息的数据决策问题。但是在如何利用确定数据样本指导不确定数据求解方面,还需要进一步深度研究。为了... 

【文章来源】: 徐阳 安徽大学

【文章页数】:66 页

【学位级别】:硕士

【部分图文】:

基于类别特征表示边界域处理的三支决策模型研究


正域对应的多层特征表示Figure3.1HierarchicalfeaturerepresentationofPOSregion

数据集,界域,杆状


安徽大学硕士学位论文23和负域后,对于Spambase数据集来说,正域对应10层特征表示,负域对应10层特征表示,形成10×10种特征表示组合,通过算法3-1对边界域进行验证后,为了更好的展示实验结果,我们以杆状图的形式进行展示,在图3.3(b)中可以清晰看出,正域对应的第9层特征表示+(9)和负域对应的第7层特征表示(7)划分效果最好,即二者的组合可以更好的处理不确定的边界域样本,并且可以正确划分500个不确定样本;同理,对于Chess数据集,正域对应5层特征表示,负域对应4层特征表示,形成5×4种特征表示层组合,通过算法3-1对边界域的验证,在杆状图3.1(c)种,可以清晰看出:正域对应的第4层+(4),负域对应的第2层(2)是最优的特征表示组合,可以有效划分691个边界域样本。图3.2Spambase数据集Figure3.2Spambasedataset图3.3Chess数据集Figure3.3Chessdataset

数据集,界域,杆状


安徽大学硕士学位论文23和负域后,对于Spambase数据集来说,正域对应10层特征表示,负域对应10层特征表示,形成10×10种特征表示组合,通过算法3-1对边界域进行验证后,为了更好的展示实验结果,我们以杆状图的形式进行展示,在图3.3(b)中可以清晰看出,正域对应的第9层特征表示+(9)和负域对应的第7层特征表示(7)划分效果最好,即二者的组合可以更好的处理不确定的边界域样本,并且可以正确划分500个不确定样本;同理,对于Chess数据集,正域对应5层特征表示,负域对应4层特征表示,形成5×4种特征表示层组合,通过算法3-1对边界域的验证,在杆状图3.1(c)种,可以清晰看出:正域对应的第4层+(4),负域对应的第2层(2)是最优的特征表示组合,可以有效划分691个边界域样本。图3.2Spambase数据集Figure3.2Spambasedataset图3.3Chess数据集Figure3.3Chessdataset

【参考文献】:
期刊论文
[1]基于三支决策的不平衡数据过采样方法[J]. 胡峰,王蕾,周耀.  电子学报. 2018(01)
[2]基于CCA的代价敏感三支决策模型[J]. 张燕平,邹慧锦,赵姝.  南京大学学报(自然科学). 2015(02)
[3]分层递阶的模糊商空间结构分析[J]. 张清华,王国胤,刘显全.  模式识别与人工智能. 2008(05)

硕士论文
[1]基于商空间的粒计算及其在数据挖掘中的应用[D]. 梁远银.四川师范大学 2013



本文编号:2966900

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/2966900.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3a2c2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com