基于特征迁移与模型迁移的分类器设计
本文关键词:基于特征迁移与模型迁移的分类器设计 出处:《中国矿业大学》2017年博士论文 论文类型:学位论文
更多相关文章: 特征迁移 模型迁移 迁移学习 分类器 领域 分布差异
【摘要】:互联网时代,信息自动分类技术已经成为人类获取有价值信息的重要工具,也是机器学习、模型识别和数据挖掘等领域研究的核心。如何采用机器学习方法构建高性能分类器,已成为人工智能领域广泛研究的问题。然而,随着问题的深入研究以及应用领域的拓展,传统机器学习方法逐渐暴露出许多不足。其中,对其影响最大的是:它要求训练数据集与测试数据集的样本概率分布相一致,这一要求在现实应用中通常难以满足。迁移学习的出现克服了这一不足,它借助一个或者多个与当前任务领域(目标领域)存在分布差异但又有一些内部联系的相关领域(源领域)知识,来帮助目标领域分类器进行学习,实现领域间的知识转移,成为了新的研究框架。迁移学习丰富了机器学习理论,拓展了其应用范围,逐渐成为一个新的研究方向。本文以设计高性能分类器为目的,以迁移学习为研究对象,从构建特征迁移分类器与模型迁移分类器两个角度出发,通过对领域间分布差异度量、半监督迁移、柔性投影约束、神经网络模型迁移以及知识迁移与分类器统一优化等问题进行研究与探索,提出了7种基于迁移学习的分类器。主要研究内容如下:1.基于领域间分布差异度量的特征迁移分类器。首先,针对传统领域间分布差异度量方法忽略单个样本对全局度量贡献差异性而影响特征迁移算法性能的问题,提出两种算法:基于最大分布加权均值差异的联合分布调整与基于样本局部判别权重的加权迁移成分分析。它们分别采用白化余弦相似性度量与局部近邻圆为源领域和目标领域所有样本设计相应的权重,将此权重引入最大均值差异度量中,体现样本个体在度量中的差异性。在此基础上,结合联合分布调整,来缩小领域间的边缘分布差异与条件分布差异,实现知识的跨领迁移。此外,基于样本局部判别权重的加权迁移成分分析算法还将线性判别分析引入目标函数,在实现知识迁移的同时,提高算法的类别可分性;其次,针对传统领域间分布差异度量方法存在内存消耗大,无法体现样本间差异性等不足,提出跨领域均值逼近差异度量方法,它通过测量源领域与目标领域样本到对方领域样本均值点的距离平方总和,来度量领域间的分布差异。在此基础上,结合子空间学习,提出特征迁移算法:跨领域均值联合逼近嵌入。它以跨领域均值逼近差异度量作为目标函数,通过标签迭代精化机制,实现领域间边缘分布差异和条件分布差异的共同调整,完成知识的跨领域迁移。最后,将上述特征迁移算法与基准分类器相结合用于分类实验,验证所提算法的有效性和优越性。2.基于半监督与柔性投影约束的特征迁移分类器。首先,针对传统特征迁移算法对样本原始结构信息与标签信息利用不足的问题,提出算法:基于跨领域均值约束的半监督迁移判别分析。它将半监督判别分析与联合分布调整相结合,并引入跨领域均值约束机制,在实现知识迁移的同时,充分利用样本的原始结构信息与标签信息,提高算法的分类性能;其次,针对传统特征迁移算法在特征子空间转换过程中投影过于刚性且对领域间自身几何结构和标签信息利用不充分的问题,提出算法:半监督柔性联合分布调整。它将柔性投影约束引入联合分布调整中,改善共享特征子空间性能;同时结合流形对齐与线性判别分析,在知识迁移过程中充分利用数据的原始结构信息和标签信息,来提高算法的分类精度。最后,将上述特征迁移算法与k近邻分类器相结合用于分类实验,验证算法的有效性和优越性。3.基于极限学习机与Softmax回归的模型迁移分类器。作为一种单层前馈神经网络,极限学习机(ELM)在模式识别与机器学习领域已经被证明是一种高效的学习机制。然而,在标记训练样本数量较少的情况下,极限学习机的性能会下降。为此,设计一种具有知识迁移能力的极限学习机:基于输出权重对齐的迁移极限学习机,它通过分别对齐源领域与目标领域间的ELM输出权重矩阵,来缩小领域间的分布差异;同时,在目标函数中加入领域间ELM输出权重矩阵的逼近项,实现知识的跨领域迁移;最后,将目标函数转化为最小二乘问题进行求解,并执行分类任务;为实现知识迁移过程与分类器训练过程的统一优化,设计一种具有知识迁移能力的分类器:迁移Softmax回归。它通过将联合分布调整机制引入Softmax回归目标函数中,构建具有知识迁移能力的分类器;然后采用梯度下降法对新的目标函数进行求解,实现分类模型参数与知识迁移过程的统一优化;最后,通过分类实验验证上述分类器的有效性和优越性。
[Abstract]:In this paper , we study and explore a new research frame based on the difference between the weighted mean value of the maximum distribution and the sample probability distribution of the data set . This paper proposes an algorithm based on semi - supervised flexible joint distribution , which combines semi - supervised discriminant analysis with a k - neighbor classifier to improve the classification accuracy of the algorithm .
【学位授予单位】:中国矿业大学
【学位级别】:博士
【学位授予年份】:2017
【分类号】:TP18
【相似文献】
相关期刊论文 前10条
1 郭红玲;程显毅;;多分类器选择集成方法[J];计算机工程与应用;2009年13期
2 吕岳,施鹏飞,赵宇明;多分类器组合的投票表决规则[J];上海交通大学学报;2000年05期
3 韩宏;杨静宇;;多分类器组合及其应用[J];计算机科学;2000年01期
4 陈刚,戚飞虎;多分类器结合的人脸识别[J];上海交通大学学报;2001年02期
5 韩宏,杨静宇,娄震;基于层次的分类器组合[J];南京理工大学学报(自然科学版);2002年01期
6 赵谊虹,程国华,史习智;多分类器融合中一种新的加权算法[J];上海交通大学学报;2002年06期
7 王正群,叶晖,孙兴华,杨静宇;模糊多分类器组合[J];小型微型计算机系统;2003年01期
8 杨利英,覃征,王向华;多分类器融合实现机型识别[J];计算机工程与应用;2004年15期
9 杨利英,覃征,王卫红;多分类器融合系统设计与应用[J];计算机工程;2005年05期
10 陈湘;;1-范数软间隔分类器的风险[J];湖北大学学报(自然科学版);2006年02期
相关会议论文 前10条
1 王占一;徐蔚然;刘东鑫;郭军;;一种基于两级分类器的垃圾短信过滤方法[A];第五届全国信息检索学术会议论文集[C];2009年
2 翟静;李海宏;唐常杰;陈敏敏;李智;;可验证对象集分类器的再训练演进[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
3 陈继航;刘家锋;赵巍;唐降龙;;联机手写识别笔段特征分类器的学习方法[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年
4 穆明生;;基于特征集的多种分类器模型的在线笔迹认证[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
5 彭涛;左万利;赫枫龄;;基于链接上下文的分类器主题爬行技术(英文)[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
6 王岚;陈珂;迟惠生;;基于多特征组合多分类器的方法用于“与文本无关”的说话人辨认[A];第四届全国人机语音通讯学术会议论文集[C];1996年
7 谢秋玲;;应用于心电图分类的KNN-SVM分类器研究[A];2006中国控制与决策学术年会论文集[C];2006年
8 胡琼;汪荣贵;胡韦伟;孙见青;;基于级联分类器的快速人脸检测方法[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
9 李兰春;王双成;杜瑞杰;;认知结构评估的动态贝叶斯网络分类器方法[A];2011年中国智能自动化学术会议论文集(第一分册)[C];2011年
10 邵小健;段华;贺国平;;一种改进的最少核分类器[A];中国运筹学会第七届学术交流会论文集(上卷)[C];2004年
相关重要报纸文章 前10条
1 王素琴邋刘晓林 通讯员 王新华;宇如聪强调用好16个新数据集产品[N];中国气象报;2008年
2 记者 刘浪 通讯员 廖雅琴;中国首套数字化“可视人”数据集在渝通过成果鉴定[N];重庆日报;2003年
3 通讯员廖雅琴记者冯竞;“国人数字化可视人体数据集”完成[N];科技日报;2003年
4 金水高 刘丽华 陶庄;基本数据集标准新进展[N];计算机世界;2006年
5 上海 陈纯;初识T-SQL,,恋情的开始[N];电脑报;2004年
6 黄明;精子分类器决定生男生女[N];广东科技报;2000年
7 昌家杰 邹莹 本报记者 于莘明;探究“数字人”的虚与实[N];科技日报;2005年
8 山水;艾斯本与NIST集合数据集[N];中国石化报;2007年
9 张绍祥 李国辉;研究领域:以人为本[N];计算机世界;2003年
10 张荔子 秦笃烈;“数字人”走向应用[N];健康报;2006年
相关博士学位论文 前10条
1 臧绍飞;基于特征迁移与模型迁移的分类器设计[D];中国矿业大学;2017年
2 张非;对抗逃避攻击的防守策略研究[D];华南理工大学;2015年
3 张文博;多类别智能分类器方法研究[D];西安电子科技大学;2014年
4 许劲松;智能交通中目标检测与分类关键技术研究[D];南京理工大学;2014年
5 赵作林;基于图像分析的北京地区杨树种类识别研究[D];北京林业大学;2015年
6 任亚峰;基于标注和未标注数椐的虚假评论识别研究[D];武汉大学;2015年
7 曹鹏;不均衡数据分类方法的研究[D];东北大学;2014年
8 刘明;分类器组合技术研究及其在人机交互系统中的应用[D];北京交通大学;2008年
9 严志永;在划分数据空间的视角下基于决策边界的分类器研究[D];浙江大学;2011年
10 王U
本文编号:1396119
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/1396119.html