基于保留分类信息的多任务特征学习算法
【图文】:
冗余;近似交替方向法中图法分类号TP181;TP391特征选择是一种非常有效的降维方法,其旨在从原始数据中选择一组具有较高区分能力的特征组成特征子集[1],从而达到降低维度以及提高精度的目的[2].特征评价准则在特征选择过程中必不可少,被准则评价为优秀的特征会被加入到特征子集中而成为降维空间的一个维度,而非优的特征会被淘汰.Fig.1Distributionsof2-dimensionalinstancesbelongingtothreeclasses图13类样本在2维空间的分布图目前常见的特征评价准则在通常情况下多用于单变量度量,其缺点在于无法保证选出的特征子集的最优性.首先,对某些类别具有高辨识度的特征不能被选出.如图1(a)所示,特征fi能较好地分离类别1和类别3,却不能辨识属于类别2的样本.同样,特征fj能较好地辨识类别2,但无法辨识类别1和类别3.所以在使用单变量评价准则的特征选择中,fi与fj会由于不能有效识别所有类而被赋予较低的权重,从而被淘汰.然而,在由2个特征组成的子空间中,所有样本均可以被正确识别,如图1(b)中直方图所示.这归因于fi与fj对不同的类别具有互补的识别性能,而这种互补性在单变量度量中往往被忽视.其次,特征之间的高度冗余性也是造成单变量度量标准选出的特征子集往往比预期性能要差的原因.冗余特征意味着其所包含的分类信息已包含于其他已选择的特征中,无法提供新的有价值的分类信息[3].而单变量度量往往无法排除掉这类特征.Fig.2Corre
冗余;近似交替方向法中图法分类号TP181;TP391特征选择是一种非常有效的降维方法,其旨在从原始数据中选择一组具有较高区分能力的特征组成特征子集[1],从而达到降低维度以及提高精度的目的[2].特征评价准则在特征选择过程中必不可少,被准则评价为优秀的特征会被加入到特征子集中而成为降维空间的一个维度,而非优的特征会被淘汰.Fig.1Distributionsof2-dimensionalinstancesbelongingtothreeclasses图13类样本在2维空间的分布图目前常见的特征评价准则在通常情况下多用于单变量度量,其缺点在于无法保证选出的特征子集的最优性.首先,对某些类别具有高辨识度的特征不能被选出.如图1(a)所示,特征fi能较好地分离类别1和类别3,却不能辨识属于类别2的样本.同样,特征fj能较好地辨识类别2,但无法辨识类别1和类别3.所以在使用单变量评价准则的特征选择中,fi与fj会由于不能有效识别所有类而被赋予较低的权重,从而被淘汰.然而,在由2个特征组成的子空间中,所有样本均可以被正确识别,如图1(b)中直方图所示.这归因于fi与fj对不同的类别具有互补的识别性能,而这种互补性在单变量度量中往往被忽视.其次,,特征之间的高度冗余性也是造成单变量度量标准选出的特征子集往往比预期性能要差的原因.冗余特征意味着其所包含的分类信息已包含于其他已选择的特征中,无法提供新的有价值的分类信息[3].而单变量度量往往无法排除掉这类特征.Fig.2Corre
【相似文献】
相关期刊论文 前10条
1 ;分类信息[J];互联网天地;2007年09期
2 ;搜狐、广联携手共建分类信息[J];计算机与网络;1999年20期
3 ;广联 新浪合作分类信息[J];每周电脑报;1999年38期
4 吴厚斌;;分类信息:此地有金?[J];软件世界;2006年09期
5 贾丽华;;公益活动茁新芽 分类信息铺沃土[J];数码世界;2006年10期
6 ;分类信息网罗天下财富[J];现代营销;2006年06期
7 李宗扬;;路透社的屏幕世界[J];中国记者;1989年06期
8 马鸿;;基于分类信息平台的多业务融合模式探索[J];中国新通信;2010年19期
9 ;分类信息[J];人像摄影;2009年02期
10 赵春燕;;分类信息已成风投新宠 未来洗牌可能蜕变新泡沫[J];IT时代周刊;2006年11期
相关重要报纸文章 前10条
1 沈海燕;网上分类信息突显奥运商机[N];中国质量报;2007年
2 杜昊;分类信息凸现服务价值[N];计算机世界;2006年
3 李天宇;在线分类信息尚需等待[N];计算机世界;2006年
4 本报记者 胡安静;分类信息藏猫腻 投资兼职要谨慎[N];江苏科技报;2007年
5 毛;易登网为天涯量身定做分类信息平台[N];计算机世界;2008年
6 本报记者 傅春荣;金融危机“火”了分类信息行业[N];中华工商时报;2009年
7 山水;分类信息成为网络广告的生力军[N];中国工商报;2008年
8 本报记者 郭白岩;国内外分类信息齐步走[N];中国经营报;2009年
9 世文;专业联姻人气58同城网欲成就分类信息霸业[N];科技日报;2006年
10 ;风险投资助推中国分类信息网大洗牌[N];人民邮电;2006年
相关硕士学位论文 前3条
1 周炯;基于DDS的金融数据订阅分发系统设计[D];复旦大学;2014年
2 崔云飞;分类信息网服务提供商的民事责任研究[D];清华大学;2015年
3 张晓东;基于ASP分类信息系统的设计与实现[D];电子科技大学;2012年
本文编号:2586452
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2586452.html