海量天文光谱数据中白矮主序双星的发现研究
发布时间:2017-04-13 05:01
本文关键词:海量天文光谱数据中白矮主序双星的发现研究,由笔耕文化传播整理发布。
【摘要】:随着世界各国的各大天文台的落成与不断地运行,天文数据也在以惊人的速度飞速地增长,对海量天文数据的处理也成为了目前天文领域迫切需要解决的问题。这些海量的数据包含了测光数据,光谱数据和天文图像数据等多种数据,本文主要针对天体光谱数据的预处理和自动分类进行研究,因为海量的光谱数据中隐含着很多时变天体、稀少天体,甚至还有一些未知天体,而特殊天体的发现对天文领域的一些宇宙演变规律以及研究生命的起源等都有着特殊的意义。虽然有了这些天体的光谱数据,但是仍然无法确定他们的类型,仅仅靠天文观测来发现新天体是非常困难的,工作量也很庞大,所以很多计算机领域研究者着重于研究光谱的自动分类的方法,也有很多研究者研究挖掘特殊天体的方法。研究发现很多研究人员在使用计算机的自动分类技术来完成恒星光谱的自动分类工作,而特殊天体的发现是其中一个非常重要的研究领域。本文主要针对斯隆数字巡天发布的相关的海量光谱数据进行分析,重点研究了特殊天体的光谱数据特征,分析光谱数据的高维特征,找出适合高维光谱数据的降维算法,确定其最佳维数特征;并通过算法的比较和优化构造不同的分类模型,最终通过实验对比确定最终的高准确率的分类模型。目的是发现新的特殊天体WDMS (WhiteDwarf+M Sequence Binaries,白矮主序双星),从而对前人已发现的结果进行补充,为天体演化、密度分布、结构等问题提供了更好的条件,同时也为进一步探究银河系的形成与演化起到了不可或缺的作用。本文研究了高维的天体光谱数据的有效的特征提取方法并确定WDMS的最佳降维维数。分别研究了线性特征提取方法和非线性特征提取方法对高维的光谱数据进行降维。针对线性特征提取方法主要使用了PCA(主变量分析)的方法提取光谱的主要特征值构造光谱特征矩阵,通过主成分分析,能够从样本集中找到一组变换基P。针对非线性性的方法主要使用了流形学习算法:等距特征映射(Isometric Feature Mapping, ISOMAP);和深度学习的栈式自编码(SAE)。ISOMAP采用了微分几何中的测地线距离,而非欧式距离;栈式自编码器能够对新输入的光谱数据进行特征提取,利用训练得到的权值和光谱进行线性组合即可得到特征光谱数据。最后对线性与非线性的特征提取方法进行对比,从时间效率和准确度上确定更适合高维光谱数据的特征提取方法,并最终与分类算法结合确定WDMS的最佳维数特征。本文的主要创新点有:1.使用深度学习实现对低信噪比的光谱数据进行数据降维。因为对于高信噪比的光谱数据使用线性的特征提取方法能够得到较高的分类准确率,但是对于低信噪比光谱数据分类效果不是很好,目前大多数的WDMS的研究者都主要研究信噪比高的光谱,而低信噪比的光谱由于光谱特征不够明显,所以研究上有一定的困难性,而本文通过实验证明深度学习对于低信噪比的光谱数据也有很好的特征提取的效果。2. WDMS的分类模型构造。基于确定好的降维算法,构造了不同的分类模型,并对比了不同分类模型的分类效果,最终确定了针对SDSS(斯隆数字巡天)发布的DR10的全部数据的分类模型。该模型是通过对分类算法和聚类算法的分类的准确率进行对比,然后将二者进行整合,利用聚类算法剔除大量的非WDMS,然后对剩余的光谱采用分类的方法,并对分类方法进行优化,提出了一个基于聚类+分类的高准确率的WDMS的发现模型。最终通过该模型在DR10中共找出了4986个结果,其中4240个是WDMS,经过验证目前没有被发现的有22个。实验表明使用有效的数据挖掘方法进行特殊天体的自动搜索快速、准确率高、分类效果明显,可以将此方法应用到其他的望远镜数据上。3.对已发现的WDMS构造颜色特征模型。Szkody提出的测光判据为相关研究提供了有效的可行性依据,本论文通过构建具有多项式特性的高维映射神经网络和径向基神经网络,对WDMS的颜色特征进行深度探索,拟合出分类效果更佳明显的颜色特征模型,从而将该模型使用到SDSS发布的测光数据中,可以对海量的测光数据进行有效的数据筛选,从而大大提高了数据挖掘的效率。同时将该模型作为前面分类模型的数据预处理模型,完成海量数据挖掘的数据筛选工作,然后使用分类模型完成分类工作,实现了分类模型的时间效率的改进,在分类的准确率上也得到了一定的提高。
【关键词】:WDMS 数据挖掘 ISOMAP 支持向量机 神经网络 深度学习
【学位授予单位】:山东大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:P145.5;TP311.13
【目录】:
- 摘要9-11
- ABSTRACT11-14
- 第1章 绪论14-26
- 1.1 研究背景和意义14-16
- 1.2 天文光谱数据研究16-22
- 1.2.1 巡天项目16-18
- 1.2.2 特殊天体WDMS研究18-22
- 1.3 天文数据挖掘的研究现状22-23
- 1.4 本文的主要研究内容23-24
- 1.5 本文的主要工作和创新点24-25
- 1.6 论文的组织结构25-26
- 第2章 WDMS特征提取与最佳维数确定26-48
- 2.1 WDMS光谱实验数据26-28
- 2.2 线性特征提取28-32
- 2.2.1 算法研究28-29
- 2.2.2 基于PCA的光谱数据降维29-32
- 2.3 非线性特征提取32-42
- 2.3.1 算法研究32-35
- 2.3.2 基于ISOMAP的光谱数据降维35-37
- 2.3.3 基于深度学习的光谱数据降维37-42
- 2.4 WDMS最佳维数确定42-45
- 2.4.1 PCA最佳维数确定42-43
- 2.4.2 ISOMAP最佳维数确定43-44
- 2.4.3 栈式自编码最佳维数确定44-45
- 2.5 实验结果分析45-47
- 2.6 本章小结47-48
- 第3章 WDMS分类模型构造48-69
- 3.1 聚类算法研究48-52
- 3.1.1 聚类算法48-49
- 3.1.2 WDMS的聚类实现49-52
- 3.2 分类算法研究52-54
- 3.3 支持向量机的参数优化54-60
- 3.3.1 优化算法研究54-57
- 3.3.2 基于PSO的参数优化57-58
- 3.3.3 实验结果分析58-60
- 3.4 构造WDMS分类模型60-68
- 3.4.1 构造ISOMAP与优化支持向量机模型61-62
- 3.4.2 构造k近邻聚类预处理模型62-64
- 3.4.3 构造栈式自编码深度提取模型64-65
- 3.4.4 构建One-VS-All多类别自动分类模型65-66
- 3.4.5 组合模型实验对比66-68
- 3.5 本章小结68-69
- 第4章 WDMS颜色特征建模69-80
- 4.1 建模算法研究69-72
- 4.2 WDMS颜色特征模型构造72-77
- 4.2.1 多项式神经网络建模72-74
- 4.2.2 径向基神经网络建模74-75
- 4.2.3 实验数据75
- 4.2.4 实验过程75-77
- 4.3 实验结果分析77-79
- 4.4 本章小结79-80
- 第5章 总结与展望80-82
- 5.1 本文总结80-81
- 5.2 研究展望81-82
- 参考文献82-88
- 致谢88-89
- 攻读学位期间发表的学术论文目录89-90
- 攻读学位期间参与科研项目情况90-91
- 发表论文91-109
- 附件109
【参考文献】
中国期刊全文数据库 前4条
1 覃冬梅,胡占义,赵永恒;基于支撑矢量机的天体光谱自动分类方法[J];光谱学与光谱分析;2004年04期
2 姜斌;罗阿理;赵永恒;;海量光谱中激变变星候选体的数据挖掘[J];光谱学与光谱分析;2011年08期
3 罗阿理,赵永恒;使用小波技术自动搜寻天体谱线[J];天体物理学报;2000年04期
4 ;New supernova candidates from the SDSS-DR7 spectral survey[J];Research in Astronomy and Astrophysics;2009年06期
本文关键词:海量天文光谱数据中白矮主序双星的发现研究,由笔耕文化传播整理发布。
,本文编号:302831
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/302831.html