基于机器学习的脉冲星候选样本分类算法研究
发布时间:2022-02-10 22:31
脉冲星搜索是射电天文学中的重要前沿领域。随着现代搜索设备性能的不断提升,分辨率和灵敏度显著提高,设备可以接收到更微弱的脉冲星信号的同时,接收到的干扰信号也越来越多。因此,现代射电天文设备会接收到大量的数据,但脉冲星信号只占其中的一小部分。同时,部分射频干扰(RFI)形似脉冲星信号,这也增加了样本分类的难度。因而,如何从海量信号中准确地识别出脉冲星信号成为一个亟需解决的问题。本文围绕着使用机器学习算法解决脉冲星候选样本分类的问题,考虑不同应用场景和需求,探索了监督学习方法、半监督学习方法和无监督学习方法在脉冲星候选样本分类问题上的应用。首先,针对脉冲星样本集不均衡且缺少对专家设计的人工特征优化分析的问题,提出了一种用于不均衡条件下脉冲星样本分类的混合集成学习算法。通过引入树模型对特征的相对重要度进行分析和特征选择,优化特征集合;针对样本极度不均衡的情况,借鉴Easy Ensemble思想将不均衡数据集分成若干较为均衡的子数据集,并利用XGBoost模型和随机森林模型作为基学习器,在子数据上分别进行代价敏感训练,从而实现混合集成,提升了基于人工特征分类的算法性能。在HTRU(High Ti...
【文章来源】:中国科学院大学(中国科学院国家空间科学中心)北京市
【文章页数】:161 页
【学位级别】:博士
【文章目录】:
摘要
abstract
缩写词
第1章 绪论
1.1 研究背景及意义
1.2 国内外研究进展
1.2.1 传统识别方法
1.2.2 机器学习方法
1.3 本文研究内容及创新点
1.3.1 研究内容与章节安排
1.3.2 创新点
第2章 基本理论
2.1 引言
2.2 脉冲星信号处理
2.3 脉冲星候选样本
2.4 脉冲星候选样本数据集
2.4.1 HTRU1和HTRU2 数据集
2.4.2 数据特点
2.5 机器学习算法
2.6 不均衡样本处理策略
2.6.1 样本层面处理策略
2.6.2 特征层面处理策略
2.6.3 算法层面处理策略
2.7 算法的测试与评价
2.7.1 算法的评估
2.7.2 算法的评价指标
2.8 本章小结
第3章 基于集成学习的脉冲星候选样本分类算法研究
3.1 引言
3.2 脉冲星专家特征
3.3 特征选择
3.3.1 常用的特征选择方法
3.3.2 基于树模型的特征相对重要度
3.4 集成学习
3.4.1 随机森林
3.4.2 XGBoost
3.5 针对不均衡脉冲星样本的混合集成模型
3.5.1 Easy Ensemble算法
3.5.2 代价敏感学习
3.5.3 改进的混合集成算法
3.6 仿真与分析
3.6.1 数据集构造
3.6.2 特征重要度分析
3.6.3 基于特征重要度的特征筛选
3.6.4 算法结果
3.6.5 算法分析
3.7 本章小结
第4章 基于卷积神经网络的脉冲星候选样本分类算法研究
4.1 引言
4.2 卷积神经网络
4.2.1 网络结构
4.2.2 参数优化
4.2.3 正则化
4.3 基于深度卷积神经网络的分类模型
4.3.1 样本不均衡问题的解决方案
4.3.2 模型结构
4.4 仿真与分析
4.4.1 数据集构造
4.4.2 模型训练
4.4.3 模型分析
4.4.4 混合集成算法与卷积神经网络算法的组合分类与比较
4.5 本章小结
第5章 基于异常检测的脉冲星候选样本分类算法的研究
5.1 引言
5.2 异常检测算法
5.2.1 算法流程
5.2.2 算法的核心参数
5.2.3 算法的特点
5.3 基于孤立森林的脉冲星异常检测
5.4 仿真与分析
5.4.1 算法结果
5.4.2 模型分析
5.4.3 混合集成算法与孤立森林异常检测算法结果比较
5.5 本章小结
第6章 基于深度聚类的脉冲星候选样本无监督分类算法的研究
6.1 引言
6.2 传统的聚类算法
6.3 结合深度学习的聚类方法
6.3.1 AE模型部分
6.3.2 聚类层部分
6.4 基于DCEC的脉冲星样本聚类
6.5 仿真与分析
6.5.1 数据集构造
6.5.2 模型设置
6.5.3 仿真分析
6.6 本章小结
第7章 总结和展望
7.1 主要工作总结
7.2 研究展望
参考文献
致谢
作者简历及攻读学位期间发表的学术论文与研究成果
【参考文献】:
期刊论文
[1]基于自归一化神经网络的脉冲星候选体选择[J]. 康志伟,刘拓,刘劲,马辛,陈晓. 物理学报. 2020(06)
[2]Pulsar candidate selection using ensemble networks for FAST drift-scan survey[J]. HongFeng Wang,WeiWei Zhu,Ping Guo,Di Li,SiBo Feng,Qian Yin,ChenChen Miao,ZhenZhao Tao,ZhiChen Pan,Pei Wang,Xin Zheng,XiaoDan Deng,ZhiJie Liu,XiaoYao Xie,XuHong Yu,ShanPing You,Hui Zhang. Science China(Physics,Mechanics & Astronomy). 2019(05)
[3]不平衡数据分类方法综述[J]. 李艳霞,柴毅,胡友强,尹宏鹏. 控制与决策. 2019(04)
[4]Application of isolation forest to extract multivariate anomalies from geochemical exploration data[J]. WU Wei,CHEN Yongliang. Global Geology. 2018(01)
[5]X射线脉冲星导航原理[J]. 帅平,陈绍龙,吴一帆,张春青,李明. 宇航学报. 2007(06)
本文编号:3619642
【文章来源】:中国科学院大学(中国科学院国家空间科学中心)北京市
【文章页数】:161 页
【学位级别】:博士
【文章目录】:
摘要
abstract
缩写词
第1章 绪论
1.1 研究背景及意义
1.2 国内外研究进展
1.2.1 传统识别方法
1.2.2 机器学习方法
1.3 本文研究内容及创新点
1.3.1 研究内容与章节安排
1.3.2 创新点
第2章 基本理论
2.1 引言
2.2 脉冲星信号处理
2.3 脉冲星候选样本
2.4 脉冲星候选样本数据集
2.4.1 HTRU1和HTRU2 数据集
2.4.2 数据特点
2.5 机器学习算法
2.6 不均衡样本处理策略
2.6.1 样本层面处理策略
2.6.2 特征层面处理策略
2.6.3 算法层面处理策略
2.7 算法的测试与评价
2.7.1 算法的评估
2.7.2 算法的评价指标
2.8 本章小结
第3章 基于集成学习的脉冲星候选样本分类算法研究
3.1 引言
3.2 脉冲星专家特征
3.3 特征选择
3.3.1 常用的特征选择方法
3.3.2 基于树模型的特征相对重要度
3.4 集成学习
3.4.1 随机森林
3.4.2 XGBoost
3.5 针对不均衡脉冲星样本的混合集成模型
3.5.1 Easy Ensemble算法
3.5.2 代价敏感学习
3.5.3 改进的混合集成算法
3.6 仿真与分析
3.6.1 数据集构造
3.6.2 特征重要度分析
3.6.3 基于特征重要度的特征筛选
3.6.4 算法结果
3.6.5 算法分析
3.7 本章小结
第4章 基于卷积神经网络的脉冲星候选样本分类算法研究
4.1 引言
4.2 卷积神经网络
4.2.1 网络结构
4.2.2 参数优化
4.2.3 正则化
4.3 基于深度卷积神经网络的分类模型
4.3.1 样本不均衡问题的解决方案
4.3.2 模型结构
4.4 仿真与分析
4.4.1 数据集构造
4.4.2 模型训练
4.4.3 模型分析
4.4.4 混合集成算法与卷积神经网络算法的组合分类与比较
4.5 本章小结
第5章 基于异常检测的脉冲星候选样本分类算法的研究
5.1 引言
5.2 异常检测算法
5.2.1 算法流程
5.2.2 算法的核心参数
5.2.3 算法的特点
5.3 基于孤立森林的脉冲星异常检测
5.4 仿真与分析
5.4.1 算法结果
5.4.2 模型分析
5.4.3 混合集成算法与孤立森林异常检测算法结果比较
5.5 本章小结
第6章 基于深度聚类的脉冲星候选样本无监督分类算法的研究
6.1 引言
6.2 传统的聚类算法
6.3 结合深度学习的聚类方法
6.3.1 AE模型部分
6.3.2 聚类层部分
6.4 基于DCEC的脉冲星样本聚类
6.5 仿真与分析
6.5.1 数据集构造
6.5.2 模型设置
6.5.3 仿真分析
6.6 本章小结
第7章 总结和展望
7.1 主要工作总结
7.2 研究展望
参考文献
致谢
作者简历及攻读学位期间发表的学术论文与研究成果
【参考文献】:
期刊论文
[1]基于自归一化神经网络的脉冲星候选体选择[J]. 康志伟,刘拓,刘劲,马辛,陈晓. 物理学报. 2020(06)
[2]Pulsar candidate selection using ensemble networks for FAST drift-scan survey[J]. HongFeng Wang,WeiWei Zhu,Ping Guo,Di Li,SiBo Feng,Qian Yin,ChenChen Miao,ZhenZhao Tao,ZhiChen Pan,Pei Wang,Xin Zheng,XiaoDan Deng,ZhiJie Liu,XiaoYao Xie,XuHong Yu,ShanPing You,Hui Zhang. Science China(Physics,Mechanics & Astronomy). 2019(05)
[3]不平衡数据分类方法综述[J]. 李艳霞,柴毅,胡友强,尹宏鹏. 控制与决策. 2019(04)
[4]Application of isolation forest to extract multivariate anomalies from geochemical exploration data[J]. WU Wei,CHEN Yongliang. Global Geology. 2018(01)
[5]X射线脉冲星导航原理[J]. 帅平,陈绍龙,吴一帆,张春青,李明. 宇航学报. 2007(06)
本文编号:3619642
本文链接:https://www.wllwen.com/kejilunwen/tianwen/3619642.html