混合稀疏正则化的多视角无监督特征选择
发布时间:2021-06-28 08:13
特征选择是机器学习和数据挖掘中的高效且有效的数据预处理技术,通过去除数据中的不相关和冗余特征提高学习性能,同时揣摩维度和计算复杂度。特征选择提高了对学习模型的可理解性,互联网和物联网已经导致全球每天大量数据的大量积累,积累的原始数据维度很高,需要巨大的存储空间,高维度数据使得现有的某些机器学习算法无效,最优特征选择在大数据时代变得更加重要。数据可以来源于不同的背景和模态,并从多个视角进行描述。研究发现,在处理多视角数据的特征维数时,由于其固有的多视角和高维特性,在无监督学习任务中非常具有挑战性。实践证明多视角中的关系表示在处理多视角无监督特征选择时是特别困难的。本文针对这一问题展开研究提出了一种新的多视角无监督特征选择方法,该方法在多视角和独立特征中加入了稀疏性,考虑到各个视角的重要性,而不必在互补信息利用中引入事先没定的权重。本文采用了七个公开的数据集进行实验,每个数据集至少包含三个不同的视角作为基准进行比较。在参数设置方面,邻域k在所有数据集和所有对比算法上均设置为5。λ1和λ2的参数调整采用网格搜索策略,它保证了所涉及矩阵的稀疏性。特征维度的设置与之前实验相同,展示的实验结果为在...
【文章来源】:天津大学天津市 211工程院校 985工程院校 教育部直属院校
【文章页数】:63 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 Feature Selection
1.1 Introduction
1.1.1 Label categorization
1.1.2 Selection Strategy categorization
1.2 Related work
1.3 Averaging and Feature Selection
1.4 Objective of this work
1.5 Summary
第2章 Emerging Challenges and Related Work
2.1 High Dimensionality
2.1.1 Stability
2.1.2 Sparsity
2.1.3 Multi-source feature selection
2.2 Big Data
2.2.1 Scalability
2.2.2 Real-time processing
2.2.3 Distributed Feature Selection
2.2.4 Multi-Source Data and Multi-View Data
2.2.5 Visualization and Interpretability
2.2.6 Model Selection
2.3 Summary
第3章 Unsupervised Feature Selection
3.1 Multi-view Unsupervised Feature Selection
3.2 Experiments
3.2.1 Datasets
3.2.2 Parameter setting
3.2.3 Methods of Comparison
3.2.4 Performance comparison
3.3 Summary
第4章 Conclusion and Future work
4.1 Conclusion
4.2 Future work
Reference
Published Papers and Scientific Research Participation
Acknowledgements
本文编号:3253962
【文章来源】:天津大学天津市 211工程院校 985工程院校 教育部直属院校
【文章页数】:63 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 Feature Selection
1.1 Introduction
1.1.1 Label categorization
1.1.2 Selection Strategy categorization
1.2 Related work
1.3 Averaging and Feature Selection
1.4 Objective of this work
1.5 Summary
第2章 Emerging Challenges and Related Work
2.1 High Dimensionality
2.1.1 Stability
2.1.2 Sparsity
2.1.3 Multi-source feature selection
2.2 Big Data
2.2.1 Scalability
2.2.2 Real-time processing
2.2.3 Distributed Feature Selection
2.2.4 Multi-Source Data and Multi-View Data
2.2.5 Visualization and Interpretability
2.2.6 Model Selection
2.3 Summary
第3章 Unsupervised Feature Selection
3.1 Multi-view Unsupervised Feature Selection
3.2 Experiments
3.2.1 Datasets
3.2.2 Parameter setting
3.2.3 Methods of Comparison
3.2.4 Performance comparison
3.3 Summary
第4章 Conclusion and Future work
4.1 Conclusion
4.2 Future work
Reference
Published Papers and Scientific Research Participation
Acknowledgements
本文编号:3253962
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3253962.html