基于主成分分析法搭建A型星有效温度的神经网络模型
发布时间:2021-07-02 21:50
大天区面积多目标光纤光谱天文望远镜(Large Sky Area Multi-Object Fiber Spectroscopy Telescope, LAMOST,又叫郭守镜望远镜)巡天项目提供了海量恒星光谱数据,DR5数据集中包含大量A型星谱线指数和有效温度的信息。机器学习算法可以发掘数据底层相互关系的神经网络模型,已广泛应用于多个学科。通过使用DR5数据集中的A型星19种谱线指数和有效温度,通过主成分分析法给出了每种谱线指数占整个数据信息的百分比,并以此为基础,选取与有效温度关系最紧密的12种谱线指数,利用有效温度误差小于100 K的数据训练得到有效温度的神经网络回归模型。模型在测试数据集上整体表现较好,程序给出的决定系数R2为0.904,平均绝对误差为58.38 K。对比相关研究的模型,测量准确度有了明显提升。此外,通过建立模型,对有效温度误差大于100 K的原始数据重新进行测量,得到的有效温度绝对误差的平均值有了明显下降;同时DR5数据集中A5型恒星数据缺少有效温度参数,通过模型的测量,对这一部分数据进行了补充。
【文章来源】:天文研究与技术. 2020,17(03)CSCD
【文章页数】:10 页
【部分图文】:
有效温度绝对误差分布图
模型评分随指标数量的变化
图4给出了误差分布及其拟合的正态分布曲线,正态分布的数学期望为-3.668,标准差为84.167。图5是神经网络模型的学习曲线,从图中可以看出,随着训练样本数量的增加,训练得分(图中红线部分)快速增加,达到饱和之后趋于水平。测试得分(图中绿线部分)与训练得分变化趋势一致,但是并没有出现训练得分较高、测试得分较低或者测试得分达到某一值后迅速下降,即过拟合的情况。除此之外,训练得分与测试得分都处于较高的水平,因此,神经网络模型并没有欠拟合。整体来看,模型的学习曲线收敛且误差较小,是一条比较理想的学习曲线。图4 训练数据集有效温度的误差分布图
【参考文献】:
期刊论文
[1]R语言应用于LAMOST光谱分析初探[J]. 陈淑鑫,罗阿理,孙伟民. 天文研究与技术. 2017(03)
[2]基于线指数特征的海量恒星光谱聚类分析研究[J]. 王光沛,潘景昌,衣振萍,韦鹏,姜斌. 光谱学与光谱分析. 2016(08)
[3]基于神经网络的线指数恒星大气物理参数测量方法[J]. 谭鑫,潘景昌,王杰,罗阿理,屠良平. 光谱学与光谱分析. 2013(06)
[4]LAMOST spectral survey——An overview[J]. Gang Zhao 1 , Yong-Heng Zhao 1 , Yao-Quan Chu 1 , 2 , Yi-Peng Jing 3 and Li-Cai Deng 1 1 Key Laboratory for Optical Astronomy, National Astronomical Observatories, Chinese Academy of Sciences, Beijing 100012, China;2 University of Science and Technology of China, Hefei 230026, China 3 Shanghai Astronomical Observatory, Chinese Academy of Sciences, Shanghai 200030, China. Research in Astronomy and Astrophysics. 2012(07)
[5]基于神经网络的恒星大气参数自动测量[J]. 潘亚春,屠良平. 辽宁科技大学学报. 2009(01)
[6]人工神经网络在天文学中的应用[J]. 李丽丽,张彦霞,赵永恒,杨大卫. 天文学进展. 2006(04)
[7]一种基于主分量分析的恒星光谱快速分类法[J]. 覃冬梅,胡占义,赵永恒. 光谱学与光谱分析. 2003(01)
[8]主成分分析法在天体物理中的应用[J]. 李成,孔旭,程福臻. 天文学进展. 2001(01)
本文编号:3261289
【文章来源】:天文研究与技术. 2020,17(03)CSCD
【文章页数】:10 页
【部分图文】:
有效温度绝对误差分布图
模型评分随指标数量的变化
图4给出了误差分布及其拟合的正态分布曲线,正态分布的数学期望为-3.668,标准差为84.167。图5是神经网络模型的学习曲线,从图中可以看出,随着训练样本数量的增加,训练得分(图中红线部分)快速增加,达到饱和之后趋于水平。测试得分(图中绿线部分)与训练得分变化趋势一致,但是并没有出现训练得分较高、测试得分较低或者测试得分达到某一值后迅速下降,即过拟合的情况。除此之外,训练得分与测试得分都处于较高的水平,因此,神经网络模型并没有欠拟合。整体来看,模型的学习曲线收敛且误差较小,是一条比较理想的学习曲线。图4 训练数据集有效温度的误差分布图
【参考文献】:
期刊论文
[1]R语言应用于LAMOST光谱分析初探[J]. 陈淑鑫,罗阿理,孙伟民. 天文研究与技术. 2017(03)
[2]基于线指数特征的海量恒星光谱聚类分析研究[J]. 王光沛,潘景昌,衣振萍,韦鹏,姜斌. 光谱学与光谱分析. 2016(08)
[3]基于神经网络的线指数恒星大气物理参数测量方法[J]. 谭鑫,潘景昌,王杰,罗阿理,屠良平. 光谱学与光谱分析. 2013(06)
[4]LAMOST spectral survey——An overview[J]. Gang Zhao 1 , Yong-Heng Zhao 1 , Yao-Quan Chu 1 , 2 , Yi-Peng Jing 3 and Li-Cai Deng 1 1 Key Laboratory for Optical Astronomy, National Astronomical Observatories, Chinese Academy of Sciences, Beijing 100012, China;2 University of Science and Technology of China, Hefei 230026, China 3 Shanghai Astronomical Observatory, Chinese Academy of Sciences, Shanghai 200030, China. Research in Astronomy and Astrophysics. 2012(07)
[5]基于神经网络的恒星大气参数自动测量[J]. 潘亚春,屠良平. 辽宁科技大学学报. 2009(01)
[6]人工神经网络在天文学中的应用[J]. 李丽丽,张彦霞,赵永恒,杨大卫. 天文学进展. 2006(04)
[7]一种基于主分量分析的恒星光谱快速分类法[J]. 覃冬梅,胡占义,赵永恒. 光谱学与光谱分析. 2003(01)
[8]主成分分析法在天体物理中的应用[J]. 李成,孔旭,程福臻. 天文学进展. 2001(01)
本文编号:3261289
本文链接:https://www.wllwen.com/kejilunwen/tianwen/3261289.html