当前位置:主页 > 科技论文 > 自动化论文 >

基于保留分类信息的多任务特征学习算法

发布时间:2020-03-12 04:22
【摘要】:在模式识别中,特征选择是一种非常有效的降维技术.特征评价标准在特征选择过程中被用于度量特征的重要性,但目前已有的标准存在着只考虑类之间的分离性而未考虑其相关性、无法去除特征之间的分类冗余性以及多用于单变量度量而无法获取子集整体最优性等问题.提出一种保留分类信息的特征评价准则(classification information preserving,CIP),并使用多任务学习技术进行实现.CIP是一种特征子集度量方法,通过F范数实现已选特征子集的分类信息与原始数据分类信息的差异最小化,并通过l2,1范数约束选择特征个数.近似交替方向法被用于求解CIP的最优解.理论分析与实验结果表明:CIP选择的最优特征子集不仅最大程度上保留了原始数据类别之间的相关性信息,而且有效地降低了特征之间的分类冗余性.
【图文】:

分布图,维空间,样本,分布图


冗余;近似交替方向法中图法分类号TP181;TP391特征选择是一种非常有效的降维方法,其旨在从原始数据中选择一组具有较高区分能力的特征组成特征子集[1],从而达到降低维度以及提高精度的目的[2].特征评价准则在特征选择过程中必不可少,被准则评价为优秀的特征会被加入到特征子集中而成为降维空间的一个维度,而非优的特征会被淘汰.Fig.1Distributionsof2-dimensionalinstancesbelongingtothreeclasses图13类样本在2维空间的分布图目前常见的特征评价准则在通常情况下多用于单变量度量,其缺点在于无法保证选出的特征子集的最优性.首先,对某些类别具有高辨识度的特征不能被选出.如图1(a)所示,特征fi能较好地分离类别1和类别3,却不能辨识属于类别2的样本.同样,特征fj能较好地辨识类别2,但无法辨识类别1和类别3.所以在使用单变量评价准则的特征选择中,fi与fj会由于不能有效识别所有类而被赋予较低的权重,从而被淘汰.然而,在由2个特征组成的子空间中,所有样本均可以被正确识别,如图1(b)中直方图所示.这归因于fi与fj对不同的类别具有互补的识别性能,而这种互补性在单变量度量中往往被忽视.其次,特征之间的高度冗余性也是造成单变量度量标准选出的特征子集往往比预期性能要差的原因.冗余特征意味着其所包含的分类信息已包含于其他已选择的特征中,无法提供新的有价值的分类信息[3].而单变量度量往往无法排除掉这类特征.Fig.2Corre

分布图,维空间,样本,分布图


冗余;近似交替方向法中图法分类号TP181;TP391特征选择是一种非常有效的降维方法,其旨在从原始数据中选择一组具有较高区分能力的特征组成特征子集[1],从而达到降低维度以及提高精度的目的[2].特征评价准则在特征选择过程中必不可少,被准则评价为优秀的特征会被加入到特征子集中而成为降维空间的一个维度,而非优的特征会被淘汰.Fig.1Distributionsof2-dimensionalinstancesbelongingtothreeclasses图13类样本在2维空间的分布图目前常见的特征评价准则在通常情况下多用于单变量度量,其缺点在于无法保证选出的特征子集的最优性.首先,对某些类别具有高辨识度的特征不能被选出.如图1(a)所示,特征fi能较好地分离类别1和类别3,却不能辨识属于类别2的样本.同样,特征fj能较好地辨识类别2,但无法辨识类别1和类别3.所以在使用单变量评价准则的特征选择中,fi与fj会由于不能有效识别所有类而被赋予较低的权重,从而被淘汰.然而,在由2个特征组成的子空间中,所有样本均可以被正确识别,如图1(b)中直方图所示.这归因于fi与fj对不同的类别具有互补的识别性能,而这种互补性在单变量度量中往往被忽视.其次,,特征之间的高度冗余性也是造成单变量度量标准选出的特征子集往往比预期性能要差的原因.冗余特征意味着其所包含的分类信息已包含于其他已选择的特征中,无法提供新的有价值的分类信息[3].而单变量度量往往无法排除掉这类特征.Fig.2Corre

【相似文献】

相关期刊论文 前10条

1 ;分类信息[J];互联网天地;2007年09期

2 ;搜狐、广联携手共建分类信息[J];计算机与网络;1999年20期

3 ;广联 新浪合作分类信息[J];每周电脑报;1999年38期

4 吴厚斌;;分类信息:此地有金?[J];软件世界;2006年09期

5 贾丽华;;公益活动茁新芽 分类信息铺沃土[J];数码世界;2006年10期

6 ;分类信息网罗天下财富[J];现代营销;2006年06期

7 李宗扬;;路透社的屏幕世界[J];中国记者;1989年06期

8 马鸿;;基于分类信息平台的多业务融合模式探索[J];中国新通信;2010年19期

9 ;分类信息[J];人像摄影;2009年02期

10 赵春燕;;分类信息已成风投新宠 未来洗牌可能蜕变新泡沫[J];IT时代周刊;2006年11期

相关重要报纸文章 前10条

1 沈海燕;网上分类信息突显奥运商机[N];中国质量报;2007年

2 杜昊;分类信息凸现服务价值[N];计算机世界;2006年

3 李天宇;在线分类信息尚需等待[N];计算机世界;2006年

4 本报记者 胡安静;分类信息藏猫腻 投资兼职要谨慎[N];江苏科技报;2007年

5 毛;易登网为天涯量身定做分类信息平台[N];计算机世界;2008年

6 本报记者 傅春荣;金融危机“火”了分类信息行业[N];中华工商时报;2009年

7 山水;分类信息成为网络广告的生力军[N];中国工商报;2008年

8 本报记者 郭白岩;国内外分类信息齐步走[N];中国经营报;2009年

9 世文;专业联姻人气58同城网欲成就分类信息霸业[N];科技日报;2006年

10 ;风险投资助推中国分类信息网大洗牌[N];人民邮电;2006年

相关硕士学位论文 前3条

1 周炯;基于DDS的金融数据订阅分发系统设计[D];复旦大学;2014年

2 崔云飞;分类信息网服务提供商的民事责任研究[D];清华大学;2015年

3 张晓东;基于ASP分类信息系统的设计与实现[D];电子科技大学;2012年



本文编号:2586452

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2586452.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户fcdc1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com