当前位置:主页 > 科技论文 > 搜索引擎论文 >

结构化预测中N元特征选择算法的研究

发布时间:2020-04-14 20:34
【摘要】:结构化预测也叫做结构化学习,目标是从数据中学习一个复杂的结构,它是自然语言处理、数据挖掘、机器学习领域的一个研究热点。N元特征在很大程度上反映了结构化预测中“结构”的信息,是结构化预测中一类特殊且极为重要的特征。然而,绝大多数关于N元特征选择的工作,仅仅将它当作一种普通的特征来处理,而没有考虑N元特征的性质,其实质仍然是普通特征选择。少数几个研究考虑了N元特征的性质,但很不充分,而且仅仅关注具体任务中的一种或几种特征,其方法不具普遍性。因此,对结构化预测中N元特征选择的研究非常少,可以说几乎是一片空白。本文将结构化预测中N元特征选择作为一个全新的研究课题,旨在提出一种适用于结构化预测的N元特征选择的通用框架。基于对该目标的分析,论文在绪论部分就确定了该框架的大致雏形,包括特征选择的方式(封装式)、特征选择的对象(N元特征模板而非特征函数)、特征搜索策略(启发式),以及特征搜索的顺序(自下而上),并对该雏形框架可能存在的问题,包括特征选择效率、鲁棒性和过拟合,逐一给出解决方案。本文的主要工作包括以下几个方面:1)论文定义了结构化预测中的N元特征模板,系统地研究了它的性质,给出了结构化预测中N元特征重要性的大致分布,并通过实验予以验证。2)论文提出一种高效的N元单特征选择算法(SNFS)。该算法包括三个子算法:阶数重要性排序算法、水平搜索算法、特征模板对组合算法。其中,最关键的是特征模板对组合算法,它的核心思想是:根据N元特征的重要性大致分布,我们能定位最有可能的两个候选者,通过比较这两个候选者和它们的并集,我们能进一步准确地判断N元特征重要性的具体走向,从而高效地裁剪搜索空间。3)论文提出一种N元多特征选择算法(MNFS)。SNFS算法每次只能处理一种N元特征,如果任务中需要同时选择多种类型的N元特征,那么该算法必须运行多次,每次处理一种特征,最后求并集。但这种做法没有考虑多种N元特征之间的相关性,所以得到的特征集可能存在冗余。MNFS算法有效地解决了特征冗余的问题。论文通过实验全面地分析了算法的特征选择性能、效率、鲁棒性以及抗过拟合的能力,并与经典的封装式特征选择方法进行了对比。实验表明,MNFS算法的特征选择性能与经典的封装式方法大致相当,但MNFS算法极其高效、鲁棒,抗过拟合能力也优于经典的封装式方法。4)论文提出一种通用的封装式特征选择的加速方法。该方法的基本思想是:“放松”模型中跟训练时间相关的变量以加速训练过程,同时定义了一个相似度度量值TopMatches用于平横模型的预测性能和特征选择性能,并利用坐标下降法搜索相关的变量值。5)论文提出一种路径约束的维特比算法来替代结构化预测中耗时严重的转移特征,进一步提高了特征选择效率。
【学位授予单位】:华中科技大学
【学位级别】:博士
【学位授予年份】:2018
【分类号】:TP393.1

【相似文献】

相关期刊论文 前10条

1 张红涛,胡玉霞,邱道尹;遗传算法在储粮害虫特征选择中的应用[J];华北水利水电学院学报;2004年03期

2 徐雷;阎平凡;常迥;;用于特征选择的BF算法及其与B&B算法的比较[J];自动化学报;1988年05期

3 杨锦英;王碧泉;;K—W检验和熵法在单个特征选择中的应用[J];华北地震科学;1989年02期

4 陈晋苏;特征选择在电信行业客户流失分析中的应用[J];科技资讯;2005年22期

5 范劲松,方廷健;特征选择和提取要素的分析及其评价[J];计算机工程与应用;2001年13期

6 江乃雄;蔡民;;综合距离特征选择问题解的存在性与唯一性[J];计算机应用与软件;1992年01期

7 钱学双;多重筛选逐步回归特征选择法及其应用[J];信息与控制;1986年05期

8 余胜龙;赵红;;基于样本邻域保持的代价敏感特征选择[J];数据采集与处理;2018年02期

9 杜政霖;李云;;基于特征聚类集成技术的在线特征选择[J];计算机应用;2017年03期

10 崔亚芬;解男男;;一种基于特征选择的入侵检测方法[J];吉林大学学报(理学版);2015年01期

相关会议论文 前10条

1 史彩娟;沙宇阳;刘健;闫晓东;刘利平;;基于自适应半监督稀疏特征选择的图像标注[A];第十届全国信号和智能信息处理与应用学术会议专刊[C];2016年

2 刘培磊;李满生;王挺;;蛋白质相互作用有向关系抽取的特征选择[A];第五届全国信息检索学术会议论文集[C];2009年

3 袁帅;杨宏晖;申f;;基于云模型的特征评价准则[A];第三届上海——西安声学学会学术会议论文集[C];2013年

4 申f;杨宏晖;袁帅;;用于水声目标识别的互信息无监督特征选择[A];第三届上海——西安声学学会学术会议论文集[C];2013年

5 李泽辉;聂生东;陈兆学;;应用多类SVM分割MR脑图像特征选择与优化的实验研究[A];中国仪器仪表学会第九届青年学术会议论文集[C];2007年

6 李娜;曾向阳;;目标识别中的样本选择和特征选择联合算法研究[A];2009年西安-上海声学学术会议论文集[C];2009年

7 宋鹏;郑文明;赵力;;基于子空间学习和特征选择融合的语音情感识别[A];第十四届全国人机语音通讯学术会议(NCMMSC’2017)论文集[C];2017年

8 臧淼;徐惠民;张永梅;;基于局部约束和稀疏编码的自动图像标注[A];国防光电子论坛第二届激光雷达成像探测技术及应用研讨会论文集[C];2015年

9 俞士汶;王治敏;朱学锋;;文学语言与自然语言理解研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年

10 薛富强;葛临东;陈丽;;新的改进遗传算法用于调制信号特征选择[A];无线传感器网及网络信息处理技术——2006年通信理论与信号处理年会论文集[C];2006年

相关重要报纸文章 前7条

1 本报记者 李振辉;根据自身特征选择健身方式[N];广东科技报;2008年

2 海通证券 娄静邋吴先兴;把握风险收益特征选择最适合自己的基金[N];上海证券报;2007年

3 铁岭市第二高中 高军;让学生“动”起来[N];铁岭日报;2005年

4 郑卫东;高产鹅选种方法和标准[N];中国畜牧兽医报;2007年

5 《网络世界》记者 周源;云平台,只选对的[N];网络世界;2012年

6 郑军;高产鹅选种方法和标准[N];河南科技报;2016年

7 记者 丁宁;2012年,我们一起“追”的创新产品[N];上海证券报;2012年

相关博士学位论文 前10条

1 任宇林;结构化预测中N元特征选择算法的研究[D];华中科技大学;2018年

2 袁明冬;基于图的特征提取和特征选择及其应用研究[D];西安电子科技大学;2017年

3 胡小娟;基于特征选择的文本分类方法研究[D];吉林大学;2018年

4 滕旭阳;面向特征选择问题的优化方法研究[D];哈尔滨工程大学;2017年

5 张丽新;高维数据的特征选择及基于特征选择的集成学习研究[D];清华大学;2004年

6 高青斌;蛋白质亚细胞定位预测相关问题研究[D];国防科学技术大学;2006年

7 刘风;基于磁共振成像的多变量模式分析方法学与应用研究[D];电子科技大学;2014年

8 冯国忠;文本分类中的贝叶斯特征选择[D];东北师范大学;2011年

9 梁建宁;特征选择与图像匹配[D];复旦大学;2011年

10 曹杰;基于SVM的网络流量特征降维与分类方法研究[D];吉林大学;2017年

相关硕士学位论文 前10条

1 黄静远;两种高维小样本数据的分类方法对比研究[D];华中科技大学;2019年

2 张哲;基于改进引力搜索算法的SVM参数优化和特征选择[D];云南大学;2017年

3 任秀伟;基于嵌入式稀疏特征选择策略的降维算法研究[D];湖北工业大学;2018年

4 胡世赛;多样性增量特征选择技术的应用[D];内蒙古工业大学;2018年

5 黄晓娟;面向特征选择的Relief算法研究[D];苏州大学;2018年

6 杨钧;高维不完整数据的特征选择研究[D];辽宁大学;2018年

7 余胜龙;基于数据相关性的代价敏感特征选择[D];闽南师范大学;2018年

8 黄天意;基于稀疏回归的特征选择研究[D];闽南师范大学;2018年

9 朱鑫萍;论文影响力的预测方法研究[D];内蒙古大学;2018年

10 蓝恭e,

本文编号:2627681


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2627681.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户85322***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com