决策信息系统的连续型特征选取方法
发布时间:2021-03-26 15:30
在大数据应用过程中,对特征集合进行约简,降低数据维度,有助于提升数据模型的泛化能力.采用随机森林模型选择和相似性度量结合的方式对特征集合进行特征初选,并通过前向搜索策略以距离为评价方式对初选集合进行二次筛选,最终获得特征子集.算法模型采用局部遍历以提高执行效率,同时通过前向选择算法解决传统方法无法确定最优特征数目的问题.实验结果表明,本文提出的方法能更有效地选择特征子集,提高模型的分类准确率.
【文章来源】:信息与控制. 2019,48(02)北大核心CSCD
【文章页数】:8 页
【文章目录】:
0 引言
1 相关概念
1.1 连续型特征的决策信息系统
1.2 随机森林特征重要性度量
1.3 相关性度量
1.4 样本距离度量
2 随机森林—序列前向选择
2.1 序列向前搜索
2.2 随机森林特征初选
1) 随机森林特征排序
2) 相似度方法
2.3 前向选择
3 实验验证
3.1 参数设置
3.2 超参数调节
3.3 准确性对比分析
3.4 时间效率对比分析
4 结论
【参考文献】:
期刊论文
[1]基于两阶段组合预测模型的区域物流需求预测[J]. 李捷,陈彦如,杨璐. 信息与控制. 2018(02)
[2]特征选择研究综述[J]. 黄铉. 信息与电脑(理论版). 2017(24)
[3]基于Lasso特征选择的自闭症预测[J]. 常春云. 北京生物医学工程. 2017(06)
[4]基于竞争思想的分级聚类算法[J]. 张文倩,庄华亮,陈翔,何熊熊. 信息与控制. 2017(05)
[5]基于最大信息系数和近似马尔科夫毯的特征选择方法[J]. 孙广路,宋智超,刘金来,朱素霞,何勇军. 自动化学报. 2017(05)
[6]集成特征选择的最优化支持向量机分类器模型研究[J]. 赵宇,陈锐,刘蔚. 计算机科学. 2016(08)
[7]基于属性相似度的连续型特征选择方法[J]. 王宏威,李国和. 渤海大学学报(自然科学版). 2014(04)
[8]基于随机森林的特征选择算法[J]. 姚登举,杨静,詹晓娟. 吉林大学学报(工学版). 2014(01)
硕士论文
[1]基于距离相关的最小冗余最大相关特征选择法在QSAR中的应用[D]. 邓小龙.湖南农业大学 2016
本文编号:3101816
【文章来源】:信息与控制. 2019,48(02)北大核心CSCD
【文章页数】:8 页
【文章目录】:
0 引言
1 相关概念
1.1 连续型特征的决策信息系统
1.2 随机森林特征重要性度量
1.3 相关性度量
1.4 样本距离度量
2 随机森林—序列前向选择
2.1 序列向前搜索
2.2 随机森林特征初选
1) 随机森林特征排序
2) 相似度方法
2.3 前向选择
3 实验验证
3.1 参数设置
3.2 超参数调节
3.3 准确性对比分析
3.4 时间效率对比分析
4 结论
【参考文献】:
期刊论文
[1]基于两阶段组合预测模型的区域物流需求预测[J]. 李捷,陈彦如,杨璐. 信息与控制. 2018(02)
[2]特征选择研究综述[J]. 黄铉. 信息与电脑(理论版). 2017(24)
[3]基于Lasso特征选择的自闭症预测[J]. 常春云. 北京生物医学工程. 2017(06)
[4]基于竞争思想的分级聚类算法[J]. 张文倩,庄华亮,陈翔,何熊熊. 信息与控制. 2017(05)
[5]基于最大信息系数和近似马尔科夫毯的特征选择方法[J]. 孙广路,宋智超,刘金来,朱素霞,何勇军. 自动化学报. 2017(05)
[6]集成特征选择的最优化支持向量机分类器模型研究[J]. 赵宇,陈锐,刘蔚. 计算机科学. 2016(08)
[7]基于属性相似度的连续型特征选择方法[J]. 王宏威,李国和. 渤海大学学报(自然科学版). 2014(04)
[8]基于随机森林的特征选择算法[J]. 姚登举,杨静,詹晓娟. 吉林大学学报(工学版). 2014(01)
硕士论文
[1]基于距离相关的最小冗余最大相关特征选择法在QSAR中的应用[D]. 邓小龙.湖南农业大学 2016
本文编号:3101816
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3101816.html