基于XGBoost算法的恒星/星系分类研究
发布时间:2021-11-27 17:12
机器学习在当今的诸多领域已经取得了巨大的成功.尤其是提升算法.提升算法适应各种场景的能力较强、准确率较高,已经在多个领域发挥巨大的作用.但是提升算法在天文学中的应用却极为少见.为解决斯隆数字巡天(Sloan Digital Sky Survey,SDSS)数据中恒星/星系暗源集分类正确率低的问题,引入了机器学习中较新的研究成果–XGBoost (eXtreme Gradient Boosting).从SDSS-DR7 (SDSS Data Release 7)中获取完整的测光数据集,并根据星等值划分为亮源集和暗源集.首先,分别对亮源集和暗源集使用十折交叉验证法,同时运用XGBoost算法建立恒星/星系分类模型;然后,运用栅格搜索等方法调优XGBoost参数;最后,基于星系的分类正确率等指标,与功能树(Function Tree, FT)、Adaboost (Adaptive boosting)、随机森林(Random Forest, RF)、梯度提升决策树(Gradient Boosting Decision Tree, GBDT)、堆叠降噪自编码(Stacked Denoising ...
【文章来源】:天文学报. 2019,60(02)北大核心CSCD
【文章页数】:10 页
【文章目录】:
1 引言
2 斯隆数字巡天
3 提升算法
3.1 GBDT原理
3.2 XGBoost原理
4 实验测试
4.1 数据集介绍
4.2 实验分析
4.2.1 特征重要性测试
4.2.2 XGBoost模型优化
4.2.3 实验方法及模型对比
5 总结与展望
【参考文献】:
期刊论文
[1]基于非参数回归与Adaboost的恒星光谱自动分类方法[J]. 刘蓉,乔学军,张健楠,段福庆. 光谱学与光谱分析. 2017(05)
[2]基于DBN,SVM和BP神经网络的光谱分类比较[J]. 李俊峰,汪月乐,胡升,何慧灵. 光谱学与光谱分析. 2016(10)
[3]数据挖掘技术在天文学中的应用[J]. 张彦霞,赵永恒. 科研信息化技术与应用. 2011(03)
本文编号:3522720
【文章来源】:天文学报. 2019,60(02)北大核心CSCD
【文章页数】:10 页
【文章目录】:
1 引言
2 斯隆数字巡天
3 提升算法
3.1 GBDT原理
3.2 XGBoost原理
4 实验测试
4.1 数据集介绍
4.2 实验分析
4.2.1 特征重要性测试
4.2.2 XGBoost模型优化
4.2.3 实验方法及模型对比
5 总结与展望
【参考文献】:
期刊论文
[1]基于非参数回归与Adaboost的恒星光谱自动分类方法[J]. 刘蓉,乔学军,张健楠,段福庆. 光谱学与光谱分析. 2017(05)
[2]基于DBN,SVM和BP神经网络的光谱分类比较[J]. 李俊峰,汪月乐,胡升,何慧灵. 光谱学与光谱分析. 2016(10)
[3]数据挖掘技术在天文学中的应用[J]. 张彦霞,赵永恒. 科研信息化技术与应用. 2011(03)
本文编号:3522720
本文链接:https://www.wllwen.com/kejilunwen/tianwen/3522720.html