陕南寒武系底部宽川铺组微体化石人工智能识别
发布时间:2021-03-30 14:55
我国陕南寒武纪初期的宽川铺组(距今大约535百万年)以盛产磷酸盐化的微体小壳化石和球状动物胚胎化石而闻名于世,是探索早期动物门类起源和寒武纪生命大爆发研究中的一个非常重要的窗口。在宽川铺组中寻找微体化石新类型主要依赖显微镜下人工挑选的传统方法日趋低效,迫切需要新的技术手段来解决这些问题。而微体化石数量庞大,大小接近,形态简单,非常适合于采用机器学习的手段进行人工智能分类。我们在宽川铺组微体化石中尝试使用机器学习的手段来进行化石图像识别和机器分拣。采用方向梯度直方图来提取化石图像的主要向量特征,并设计了二叉树型多分类识别器进行化石数字分类。目前处理了5 000多张微体化石照片的人工智能识别,已经取得了较高的准确率。
【文章来源】:古生物学报. 2019,58(02)北大核心CSCD
【文章页数】:11 页
【部分图文】:
图6HOG特征向量组成FeaturevectorcompositionofHOG插
插图6HOG特征向量组成FeaturevectorcompositionofHOG插图7基于SVM的多分类化石识别器MulticategoryfossilrecognizerbasedonSupportVectorMachine(SVM)3.4模型训练模型训练是根据已有化石的人工分类结果学习高维线性可分的超平面参数,而每个SVM分类器都需要学习训练不同的参数。如插图8所示,三个分类器SVM1、SVM2和SVM3是将样本图像映射至高维空间后,利用已标定种类的正样本图像特征和其他样本特征一起学习在各自高维空间中的线性可分的超平面,如SVM1分类超平面、SVM2分类超平面和SVM3分类超平面,检验测试时就依据该学习训练好的分类超平面对被测样本图像进行归类。SVM分类器的模型训练主要学习得到了用于确定分类超平面的支持向量、支持向量在决策函数中的系数及决策函数的常数项,由于本文中设计了三个SVM分类器,故每个分类器的参数都需要利用该类化石图像单独训练。与此同时,为了降低同一类化石中不同个体差异对识别准确性的影响,在模型训练时尽可能准备更多具有不同形态的化石图像样本进行学习,即模型学习的化石图像类型越全面,识别的准确性越高。3.5实际测试实际测试过程中是将待测样本图像经过HOG特征提取和规范化处理后,首先利用SVM1分类器将非化石的渣滓分离,然后对管状、球状和刺状化石利用SVM2将球状化石和其他化石分开,最后利用SVM3完成管状化石和刺状化石分开。该过程可以由计算
。3.5实际测试实际测试过程中是将待测样本图像经过HOG特征提取和规范化处理后,首先利用SVM1分类器将非化石的渣滓分离,然后对管状、球状和刺状化石利用SVM2将球状化石和其他化石分开,最后利用SVM3完成管状化石和刺状化石分开。该过程可以由计算机自动对单一未知样本图像进行识别,也可以对数量众多的样本图像批量识别,能够极大降低科研人员的重复性工作量。为了更加直观地展示不同样本图像的特征提取、识别分类过程,插图9给出插图8SVM多分类器训练超平面AmulticategorytraininghyperplanebasedonSVMA.渣滓分类器高维空间示意图,区别化石和渣滓;B.球状化石分类器高维空间示意图,区别球状化石和其他化石;C.管状化石Circotheca和刺状化石Protohertzina分类器高维空间示意图,以区别这两种类型的化石。A.Aschematicdiagramofhyperplaneinthehighdimensionalspacertodistinguishdebrisandotherfossils;B.Aschematicdiagramofhyper-planetodistinguishthesphericalfossilfromotherfossilsinthehigh-dimensionaldiagram;C.AclassifierdesignatedfordistinguishingCirco-thecaandProtohertzina.741第2期张涛等:陕南寒武系微体化
本文编号:3109700
【文章来源】:古生物学报. 2019,58(02)北大核心CSCD
【文章页数】:11 页
【部分图文】:
图6HOG特征向量组成FeaturevectorcompositionofHOG插
插图6HOG特征向量组成FeaturevectorcompositionofHOG插图7基于SVM的多分类化石识别器MulticategoryfossilrecognizerbasedonSupportVectorMachine(SVM)3.4模型训练模型训练是根据已有化石的人工分类结果学习高维线性可分的超平面参数,而每个SVM分类器都需要学习训练不同的参数。如插图8所示,三个分类器SVM1、SVM2和SVM3是将样本图像映射至高维空间后,利用已标定种类的正样本图像特征和其他样本特征一起学习在各自高维空间中的线性可分的超平面,如SVM1分类超平面、SVM2分类超平面和SVM3分类超平面,检验测试时就依据该学习训练好的分类超平面对被测样本图像进行归类。SVM分类器的模型训练主要学习得到了用于确定分类超平面的支持向量、支持向量在决策函数中的系数及决策函数的常数项,由于本文中设计了三个SVM分类器,故每个分类器的参数都需要利用该类化石图像单独训练。与此同时,为了降低同一类化石中不同个体差异对识别准确性的影响,在模型训练时尽可能准备更多具有不同形态的化石图像样本进行学习,即模型学习的化石图像类型越全面,识别的准确性越高。3.5实际测试实际测试过程中是将待测样本图像经过HOG特征提取和规范化处理后,首先利用SVM1分类器将非化石的渣滓分离,然后对管状、球状和刺状化石利用SVM2将球状化石和其他化石分开,最后利用SVM3完成管状化石和刺状化石分开。该过程可以由计算
。3.5实际测试实际测试过程中是将待测样本图像经过HOG特征提取和规范化处理后,首先利用SVM1分类器将非化石的渣滓分离,然后对管状、球状和刺状化石利用SVM2将球状化石和其他化石分开,最后利用SVM3完成管状化石和刺状化石分开。该过程可以由计算机自动对单一未知样本图像进行识别,也可以对数量众多的样本图像批量识别,能够极大降低科研人员的重复性工作量。为了更加直观地展示不同样本图像的特征提取、识别分类过程,插图9给出插图8SVM多分类器训练超平面AmulticategorytraininghyperplanebasedonSVMA.渣滓分类器高维空间示意图,区别化石和渣滓;B.球状化石分类器高维空间示意图,区别球状化石和其他化石;C.管状化石Circotheca和刺状化石Protohertzina分类器高维空间示意图,以区别这两种类型的化石。A.Aschematicdiagramofhyperplaneinthehighdimensionalspacertodistinguishdebrisandotherfossils;B.Aschematicdiagramofhyper-planetodistinguishthesphericalfossilfromotherfossilsinthehigh-dimensionaldiagram;C.AclassifierdesignatedfordistinguishingCirco-thecaandProtohertzina.741第2期张涛等:陕南寒武系微体化
本文编号:3109700
本文链接:https://www.wllwen.com/kejilunwen/rengongzhinen/3109700.html