基于集成学习的M亚矮星搜索方法研究
发布时间:2021-09-08 07:10
M亚矮星是一类低质量、低光度的贫金属性的恒星,被认为是银河系中的古老群体。M亚矮星的研究对于探索银河系的演化和组成至关重要。然而由于M亚矮星和M矮星有着相似的光谱形态,使得二者往往混淆在一起。近年来随着机器学习的发展,为M矮星和M亚矮星的分类提供了许多新的方法。本文重点采用基于决策树的集成学习算法构建了M矮星和M亚矮星的分类模型。集成学习不仅能产生最终的预测结果,还能有效评估区分二者的特征。另外实验结果表明本文在LAMOST数据集上构建的LightGBM模型可以有效区分M矮星光谱和M亚矮星光谱,算法准确率达到97.22%,并成功应用到了 SDSS数据集上。本文主要分为以下四个部分:(1)数据预处理数据预处理过程包括光谱数据的获取、插值、归一化和去除大气吸收线等操作,以及数据集的划分。(2)模型构建本实验中,利用LAMOSTDR4的光谱数据,分别构建了 SVM、随机森林、XGBoost、LightGBM训练模型,其中LightGBM分类效果最好,并且运行效率最高。本文的创新点之一就是将比较先进的集成学习算法LightGBM率先应用到M矮星和M亚矮星的分类问题当中,并且通过实验结果说明了这...
【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
图1-2?SDSS?2.5米望远镜??1.2.3光谱数据介绍??光谱数据是天文研宄领域中最常用的、最重要的研究对象之一
?山东大学硕士学位论文???从剩下样本数据中随机抽取W2X100%个样本作为小梯度样本集合(W为小??梯度样本的采样率)。最后将两个样本合并就得到了?LightGBM的训练样本。??同时,为了平衡数据集的概率分布,还给小样本光谱数据设置了一个权重系??数通过这样的调节还能在一定程度上保证模型的准确率,GuolinKe??w2??在论文中给出了数学证明[44]。??实验光谱?采样光谱??编号?梯度?编号?梯度权重??2-5?2-51??选择前2个??5?3?光谱,?5?3?1??wi=l/3??I?4??剩余光谱中,随机??4?1.5?选择?2?个,w2=l/3.?6?1-?2??6?1??1?0.5??图3-4?GOSS采样示意图??图3-4,举例说明了?GOSS的采样策略,首先根据梯度对所有的光谱数??据进行排序,假设■,则算法在计算增益时,对于小梯度样本的??3?3??数据设置权重,放大^^=2倍,以平衡数据分布。LightGBM构建判别模??w2??型的过程如算法3-2:??20??
?山东大学硕士学位论文???6000-8300A,共2300A数据,间隔为1A。经过流量标准化处理后,本实验??中输入到算法模型中的是2300维的连续的光谱特征。??经过归一化和插值操作后,从数据集当中挑选出了早型(M2)的M矮??星和M亚矮星光谱和晚型(M5)的M矮星和M亚矮星光谱,如图4-1所示:???M2???14?靡’’?'I?’??1.2-?Subd:arf?L?/?I??x??i-?m?,/?/?V,?1??〇-6-?;J'(?\?^?J??0.4-??6000?6500?7000?7500?8000??Wavelength(A)???M5???x-4-?丫1??1.2?Subdwarf?,?/产'??x?/%??iL〇-?.?^?V?.?i?I??i〇.8.?m?f??1?一?,广?twT?I??a6_?j\?/?'M??。.4.?V’?d?Dwarf??6000?6500?7000?7500?8000??Wavelength(A)??图4-1?M矮星和M亚矮星的光谱形态:上半部分是M2早型,下半部分是M5晚型??图4-1为M矮星和M亚矮星的光谱形态,横坐标为6000A-8300A波??段,纵坐标为相对流量。从图4-1可以看出,M亚矮星与M矮星光谱形态??及其相似,并且具有类似的特征。其中一个显著的特征就是在可见光谱上布??满了?TiO、CaH、和CaOH等分子带。这些分子带本质上是一些有规律的光??谱线,由分子振动和转动跃迁形成,蕴含着大量的光谱信息。除了这些分子??带,M亚矮星和M矮星光谱还有许多原子特征线,比如Nal线
【参考文献】:
期刊论文
[1]低信噪比巡天数据中特殊恒星光谱的搜寻方法[J]. 吴明磊,潘景昌,衣振萍,韦鹏. 光谱学与光谱分析. 2019(02)
[2]M矮星光谱型分类研究[J]. 衣振萍,潘景昌,罗阿理. 光谱学与光谱分析. 2013(08)
[3]The Large Sky Area Multi-Object Fiber Spectroscopic Telescope (LAMOST)[J]. Xiang-Qun Cui2, Yong-Heng Zhao1, Yao-Quan Chu3, Guo-Ping Li2, Qi Li1, Li-Ping Zhang2, Hong-Jun Su1, Zheng-Qiu Yao2, Ya-Nan Wang2, Xiao-Zheng Xing3, Xin-Nan Li2, Yong-Tian Zhu2, Gang Wang1, Bo-Zhong Gu2, A-Li Luo1, Xin-Qi Xu2, Zhen-Chao Zhang2, Gen-Rong Liu2, Hao-Tong Zhang1, De-Hua Yang2, Shu-Yun Cao1, Hai-Yuan Chen2, Jian-Jun Chen1, Kun-Xin Chen2, Ying Chen1, Jia-Ru Chu3, Lei Feng1, Xue-Fei Gong2, Yong-Hui Hou2, Hong-Zhuan Hu3, Ning-Sheng Hu2, Zhong-Wen Hu2, Lei Jia1, Fang-Hua Jiang2, Xiang Jiang2, Zi-Bo Jiang2, Ge Jin3, Ai-Hua Li2, Yan Li4, Ye-Ping Li2, Guan-Qun Liu2, Zhi-Gang Liu3, Wen-Zhi Lu2, Yin-Dun Mao4, Li Men1, Yong-Jun Qi2, Zhao-Xiang Qi4, Huo-Ming Shi1, Zheng-Hong Tang4, Qing-Sheng Tao2, Da-Qi Wang1, Dan Wang1, Guo-Min Wang2, Hai Wang2, Jia-Ning Wang2, Jian Wang3, Jian-Ling Wang1, Jian-Ping Wang3, Lei Wang2, Shu-Qing Wang1, You Wang2, Yue-Fei Wang2, Ling-Zhe Xu2, Yan Xu1, Shi-Hai Yang2, Yong Yu4, Hui Yuan1, Xiang-Yan Yuan2, Chao Zhai3, Jing Zhang5, Yan-Xia Zhang1, Yong Zhang2, Ming Zhao4, Fang Zhou2, Guo-Hua Zhou2, Jie Zhu2 and Si-Cheng Zou1 1 National Astronomical Observatories, Chinese Academy of Sciences, Beijing 100012, China; 2 Nanjing Institute of Astronomical Optics and Technology, National Astronomical Observatories, Chinese Academy of Sciences, Nanjing 210042, China 3 University of Science and Technology of China, Hefei 230026, China 4 Shanghai Astronomical Observatory, Chinese Academy of Sciences, Shanghai 200030, China 5 Institute of Architecture Design and Research, Chinese Academy of Sciences, Beijing 100190, China. Research in Astronomy and Astrophysics. 2012(09)
[4]光谱流量标准化的高效计算[J]. 李乡儒. 光谱学与光谱分析. 2012(01)
[5]天文学中的数据挖掘和知识发现[J]. 张彦霞,赵永恒,崔辰州. 天文学进展. 2002(04)
本文编号:3390359
【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
图1-2?SDSS?2.5米望远镜??1.2.3光谱数据介绍??光谱数据是天文研宄领域中最常用的、最重要的研究对象之一
?山东大学硕士学位论文???从剩下样本数据中随机抽取W2X100%个样本作为小梯度样本集合(W为小??梯度样本的采样率)。最后将两个样本合并就得到了?LightGBM的训练样本。??同时,为了平衡数据集的概率分布,还给小样本光谱数据设置了一个权重系??数通过这样的调节还能在一定程度上保证模型的准确率,GuolinKe??w2??在论文中给出了数学证明[44]。??实验光谱?采样光谱??编号?梯度?编号?梯度权重??2-5?2-51??选择前2个??5?3?光谱,?5?3?1??wi=l/3??I?4??剩余光谱中,随机??4?1.5?选择?2?个,w2=l/3.?6?1-?2??6?1??1?0.5??图3-4?GOSS采样示意图??图3-4,举例说明了?GOSS的采样策略,首先根据梯度对所有的光谱数??据进行排序,假设■,则算法在计算增益时,对于小梯度样本的??3?3??数据设置权重,放大^^=2倍,以平衡数据分布。LightGBM构建判别模??w2??型的过程如算法3-2:??20??
?山东大学硕士学位论文???6000-8300A,共2300A数据,间隔为1A。经过流量标准化处理后,本实验??中输入到算法模型中的是2300维的连续的光谱特征。??经过归一化和插值操作后,从数据集当中挑选出了早型(M2)的M矮??星和M亚矮星光谱和晚型(M5)的M矮星和M亚矮星光谱,如图4-1所示:???M2???14?靡’’?'I?’??1.2-?Subd:arf?L?/?I??x??i-?m?,/?/?V,?1??〇-6-?;J'(?\?^?J??0.4-??6000?6500?7000?7500?8000??Wavelength(A)???M5???x-4-?丫1??1.2?Subdwarf?,?/产'??x?/%??iL〇-?.?^?V?.?i?I??i〇.8.?m?f??1?一?,广?twT?I??a6_?j\?/?'M??。.4.?V’?d?Dwarf??6000?6500?7000?7500?8000??Wavelength(A)??图4-1?M矮星和M亚矮星的光谱形态:上半部分是M2早型,下半部分是M5晚型??图4-1为M矮星和M亚矮星的光谱形态,横坐标为6000A-8300A波??段,纵坐标为相对流量。从图4-1可以看出,M亚矮星与M矮星光谱形态??及其相似,并且具有类似的特征。其中一个显著的特征就是在可见光谱上布??满了?TiO、CaH、和CaOH等分子带。这些分子带本质上是一些有规律的光??谱线,由分子振动和转动跃迁形成,蕴含着大量的光谱信息。除了这些分子??带,M亚矮星和M矮星光谱还有许多原子特征线,比如Nal线
【参考文献】:
期刊论文
[1]低信噪比巡天数据中特殊恒星光谱的搜寻方法[J]. 吴明磊,潘景昌,衣振萍,韦鹏. 光谱学与光谱分析. 2019(02)
[2]M矮星光谱型分类研究[J]. 衣振萍,潘景昌,罗阿理. 光谱学与光谱分析. 2013(08)
[3]The Large Sky Area Multi-Object Fiber Spectroscopic Telescope (LAMOST)[J]. Xiang-Qun Cui2, Yong-Heng Zhao1, Yao-Quan Chu3, Guo-Ping Li2, Qi Li1, Li-Ping Zhang2, Hong-Jun Su1, Zheng-Qiu Yao2, Ya-Nan Wang2, Xiao-Zheng Xing3, Xin-Nan Li2, Yong-Tian Zhu2, Gang Wang1, Bo-Zhong Gu2, A-Li Luo1, Xin-Qi Xu2, Zhen-Chao Zhang2, Gen-Rong Liu2, Hao-Tong Zhang1, De-Hua Yang2, Shu-Yun Cao1, Hai-Yuan Chen2, Jian-Jun Chen1, Kun-Xin Chen2, Ying Chen1, Jia-Ru Chu3, Lei Feng1, Xue-Fei Gong2, Yong-Hui Hou2, Hong-Zhuan Hu3, Ning-Sheng Hu2, Zhong-Wen Hu2, Lei Jia1, Fang-Hua Jiang2, Xiang Jiang2, Zi-Bo Jiang2, Ge Jin3, Ai-Hua Li2, Yan Li4, Ye-Ping Li2, Guan-Qun Liu2, Zhi-Gang Liu3, Wen-Zhi Lu2, Yin-Dun Mao4, Li Men1, Yong-Jun Qi2, Zhao-Xiang Qi4, Huo-Ming Shi1, Zheng-Hong Tang4, Qing-Sheng Tao2, Da-Qi Wang1, Dan Wang1, Guo-Min Wang2, Hai Wang2, Jia-Ning Wang2, Jian Wang3, Jian-Ling Wang1, Jian-Ping Wang3, Lei Wang2, Shu-Qing Wang1, You Wang2, Yue-Fei Wang2, Ling-Zhe Xu2, Yan Xu1, Shi-Hai Yang2, Yong Yu4, Hui Yuan1, Xiang-Yan Yuan2, Chao Zhai3, Jing Zhang5, Yan-Xia Zhang1, Yong Zhang2, Ming Zhao4, Fang Zhou2, Guo-Hua Zhou2, Jie Zhu2 and Si-Cheng Zou1 1 National Astronomical Observatories, Chinese Academy of Sciences, Beijing 100012, China; 2 Nanjing Institute of Astronomical Optics and Technology, National Astronomical Observatories, Chinese Academy of Sciences, Nanjing 210042, China 3 University of Science and Technology of China, Hefei 230026, China 4 Shanghai Astronomical Observatory, Chinese Academy of Sciences, Shanghai 200030, China 5 Institute of Architecture Design and Research, Chinese Academy of Sciences, Beijing 100190, China. Research in Astronomy and Astrophysics. 2012(09)
[4]光谱流量标准化的高效计算[J]. 李乡儒. 光谱学与光谱分析. 2012(01)
[5]天文学中的数据挖掘和知识发现[J]. 张彦霞,赵永恒,崔辰州. 天文学进展. 2002(04)
本文编号:3390359
本文链接:https://www.wllwen.com/guanlilunwen/lindaojc/3390359.html