当前位置:主页 > 科技论文 > 地质论文 >

非均衡分类算法及在地层岩性识别的应用

发布时间:2020-07-23 19:40
【摘要】:非均衡数据的分类问题作为机器学习领域十大挑战之一,近年来吸引了很多学者的深入研究。本文在深入研究并总结了当前针对非均衡数据分类方法的基础上,从数据预处理角度和集成学习角度提出了对非均衡数据分类的改进方法,并在典型非均衡数据分类领域:地层岩石数据岩性识别的应用进行了研究。本文的具体工作如下:一、提出了基于最佳均衡比的非均衡数据预处理方法(a pre-processing method for imbalance data based on the best balance ratio),简称obtio。本文提出的obtio算法通过获取每一个特定非均衡数据的最佳均衡比,从数据预处理角度提高了非均衡数据的分类效果。实验结果表明,本文提出的obtio算法相比于谷琼等人提出的混合采样技术,F-measure值提高了0.2。二、提出了一种基于聚类和装袋的非均衡数据分类方法(a method based on cluster and bagging for imbalance data classification),简称CB。本文提出的CB算法通过聚类和装袋方法获取到多个均衡数据集,并结合集成规则,从集成学习角度提高了非均衡数据的分类效果。实验结果表明,本文提出的CB算法相比于Wei-Chao Lin等人提出的Clustering-based undersampling方法,F-measure值提高了0.15。三、针对常规岩性识别方法岩性识别率低的问题,提出了一种地层岩石岩性识别方法(a method for lithology recognition of ground-layer rock data),简称LRGL。在数据预处理阶段,深入地分析了每一个岩石数据样本在岩石数据中的分布特性,通过过采样特定类型的少数类岩石数据样本,获取到均衡的岩石数据集,并运用BP神经网络进行岩性识别。实验结果表明:本文提出的LRGL方法相比于牟丹等人提出的方法,AUC值提高了0.2,且岩性识别效果稳定。
【学位授予单位】:西北大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:P628
【图文】:

效果图,算法分类,效果图


2.3.4 实验结果分析图 2.1 obtio 算法分类效果图图 2.1 横轴代表采样率 N,纵轴代表分类效果 F-measure 的值(10 条折线代表 10个数据集)。本次实验中分类器为 Na ve Bayes。从实验结果可以得出:随着采样率 N的增大,每个非均衡数据的分类效果(F-measure 值)的整体趋势是从上升到基本稳定再到下降。其原因在于,开始少数类样本的数目相对较少,分类器不能够学习到刻画各个非均衡数据集中少数类样本的特征信息,所以分类的效果仍然不佳。随着采样率 N 的继续增大,使得有相对较多的少数类样本,可供分类器在训练阶段逐渐学习到刻画非均衡数据集中少数类的信息。实验结果中,可以看出,每个数据集都有一段分类的效果基本稳定,是因为当少数类样本增加到一定数目,分类器已经学习到足以刻画该类的特征信息

预处理方法,非均衡,算法,分类算法


图 2.2 不同预处理方法的分类效果对比图获取到每个数据的最佳均衡比后,我们对本文提出的 obtio 非均衡数进一步的性能探究。从图 2.2 可以看到,本文提出的 obtio 算法分别以ayes、C4.5 作为分类算法时,F-measure 的值均高于其他两种方法且波动本文提出的 obtio 算法在处理非均衡数据时性能较优,且对分类算法

算法流程图,样本点集,数据样本,随机抽样


图 3.1 C&B 数据均衡算法流程图候选样本点集中随机抽样一个数据样本,最终组,并将其与于少数类样本进行组合,形成一个均4),我们将得到 Q 个均衡的样本集。衡数据,得到 Q 个基分类器,最后运用集成规

【参考文献】

相关期刊论文 前10条

1 王玉玺;刘波;高计县;张学丰;李顺利;刘建强;田泽普;;Auto recognition of carbonate microfacies based on an improved back propagation neural network[J];Journal of Central South University;2015年09期

2 单敬福;陈欣欣;赵忠军;葛雪;张芸;;利用BP神经网络法对致密砂岩气藏储集层复杂岩性的识别[J];地球物理学进展;2015年03期

3 王辉;黎明碧;唐勇;方银霞;丁巍伟;付洁;王聪;;基于小波神经网络的ODP1148A井岩性预测[J];地球物理学进展;2014年01期

4 LIU Zhen;LIU Qiong;;Studying cost-sensitive learning for multi-class imbalance in Internet traffic classification[J];The Journal of China Universities of Posts and Telecommunications;2012年06期

5 谷琼;袁磊;宁彬;吴钊;华丽;李文新;;一种基于混合重取样策略的非均衡数据集分类算法[J];计算机工程与科学;2012年10期

6 谷琼;袁磊;熊启军;宁彬;李文新;;基于非均衡数据集的代价敏感学习算法比较研究[J];微电子学与计算机;2011年08期

7 程险峰;李军;李雄飞;;一种基于欠采样的不平衡数据分类算法[J];计算机工程;2011年13期

8 李继安;;人工智能神经网络在岩性识别、孔隙度和渗透率预测中的应用——以十红滩铀矿床为例[J];西北地质;2010年02期

9 钟仪华;李榕;;基于主成分分析的最小二乘支持向量机岩性识别方法[J];测井技术;2009年05期

10 纪福全;程国建;王潇潇;朱战立;;构造性神经网络在测井岩性识别中的应用[J];石油矿场机械;2007年04期



本文编号:2767758

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/diqiudizhi/2767758.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户7d887***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com