地学信息工程专业优秀论文 面向非均衡数据集的机器学习及在地学数据处理中
发布时间:2016-09-06 12:17
本文关键词:面向非均衡数据集的机器学习及在地学数据处理中的应用,由笔耕文化传播整理发布。
文档介绍:
【精品】毕业论文优秀毕业论文本科论文专业学术论文参考文献资料地学信息工程专业优秀论文面向非均衡数据集的机器学习及在地学数据处理中的应用关键词:地质数据库数据挖掘人工智能机器学习摘要:分类是数据挖掘和知识发现的重要任务之一,传统的机器学习分类研究大多基于如下假设:(1)以高总体分类正确率为目标;(2)数据集中的各类样本数目基本均衡;(3)所有的分类错误会带来相同的错误代价。基于这些假设,人们研究了大量的分类算法如决策树算法、贝叶斯分类、人工神经网络、K-近邻算法、支持向量机、遗传算法等,并将其广泛应用于医学诊断、信息检索、文本分类等众多应用领域。然而,真实世界的分类问题存在很多类别非均衡的情况,数据集中某个类别的样本数可能会远多于其他类别。在这些情况下,分类器通常会倾向于将测试样本全部判别为大类而忽视小类样本,这使得到的分类器在小类样本上效果会变得很差。不平衡数据集自身的特点(少数类数据的绝对缺乏和相对缺乏、数据碎片、噪声)以及传统分类算法的局限性(不恰当的评价标准和不恰当的归纳偏置)是对不平衡数据集进行准确可靠分类的关键制约因素。因此,对不平衡数据集的分类问题已成为机器学习和模式识别领域中新的研究热点,是对传统分类...
内容来自转载请标明出处.
本文关键词:面向非均衡数据集的机器学习及在地学数据处理中的应用,,由笔耕文化传播整理发布。
本文编号:110468
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/110468.html