基于演化算法的序回归技术研究
本文关键词:基于演化算法的序回归技术研究
更多相关文章: 序回归 半监督学习 核判别分析 标签传播 演化算法 差分进化
【摘要】:在很多实际应用中,数据的类别之间存在一种自然的序关系。例如,我们用1~5星去评价一部电影,3星评价高于2星评价,而4星评价低于5星评价。和标称数据不同,我们称这样一类数据为有序数据。有序数据的类别之间可以排序,但类别之间的差异却没有精确的定义。例如,对电影的3星评价通常被认为优于2星评价,但是3星究竟比2星好多少却难以度量。预测有序数据的序的学习问题,称之为序回归。序回归有着广泛的实际应用场景,例如情感分析、信息检索、推荐系统、信用评价、医学等。序回归问题作为机器学习、数据挖掘领域重要的问题之一,越来越受到研究者们的关注。已有的工作主要集中在研究有监督序回归问题。然而,当缺少足够的有标签数据时,该问题变得难以处理。在很多实际应用中,有标签数据往往难以获取并且校对起来代价很高。而无标签数据通常大量存在,并且易于获得。因此,同时考虑有标签数据和无标签数据的半监督序回归问题具有重要的研究意义和实际价值。本文以此为动机,对半监督序回归问题做了一定的研究和讨论。本文提出了一种基于加权核判别分析的半监督序回归技术。该算法通过一个加权策略来引入无标签数据,而权重体现了不同训练数据对于类分布的贡献大小。通过同时使用有标签数据和无标签数据,可以更准确地估计类的分布信息,从而获得更好的投影向量和阈值。该投影向量将原始数据映射到一个一维的空间,使得相邻类别之间可以分隔开、相同类别的数据可以聚合紧,同时保持正确的序关系;阈值用来预测新样例的序。该算法使用一种标签传播的方法来计算权重。然而,由于标签传播算法没有考虑数据中的序信息,导致估计的权重有时不是很准确。为了更准确地估计类的分布信息并进一步提升性能,我们提出了改进的算法——基于演化算法的半监督序回归技术。该算法通过使用演化算法来优化无标签数据的权重,优化目标是使学习器拥有良好的学习性能和泛化能力。由于同时引入了无标签数据和序信息,所以该问题是一个非凸且不可导的优化问题。演化算法适用于处理这类问题,我们在本文使用差分进化算法。为了降低优化问题的维度,本文提出了一种权重更新规则和个体表示方法,用来间接地演化权重。通过该方法,问题维度从无标签样例个数量级下降到序个数量级。在多个数据集上的实验结果,证明了本文提出的两个半监督序回归算法的有效性。
【关键词】:序回归 半监督学习 核判别分析 标签传播 演化算法 差分进化
【学位授予单位】:中国科学技术大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP181
【目录】:
- 摘要5-6
- ABSTRACT6-13
- 第一章 绪论13-17
- 1.1 研究内容背景及意义13
- 1.2 文献综述及研究成果13-14
- 1.3 本文概述及主要贡献14-17
- 1.3.1 本文研究内容14-15
- 1.3.2 本文主要贡献15
- 1.3.3 本文结构15-17
- 第二章 序回归技术发展回顾17-27
- 2.1 序回归问题定义和评估指标17
- 2.2 基于有监督学习方式的序回归技术17-22
- 2.2.1 直接用传统分类或回归方法处理的序回归技术18-19
- 2.2.2 先分解成二分类问题再进行处理的序同归技术19-20
- 2.2.3 拓展传统分类模型引入序信息的序回归技术20-22
- 2.3 基于半监督学习方式的序回归技术22-23
- 2.4 基于演化算法的序回归技术23-24
- 2.4.1 演化算法及演化机器学习23-24
- 2.4.2 演化算法在序回归问题中的应用24
- 2.5 发展趋势及不足24-25
- 2.6 小结25-27
- 第三章 基于加权核判别分析的半监督序回归技术27-37
- 3.1 半监督序回归问题定义27
- 3.2 半监督学习27
- 3.3 KDLOR算法回顾27-29
- 3.4 基于加权核判别分析的半监督序回归算法29-33
- 3.4.1 估计无标签数据对每个类别的隶属度30-31
- 3.4.2 基于加权核判别分析的半监督序回归算法31-33
- 3.5 实验验证33-36
- 3.5.1 实验设置33
- 3.5.2 合成数据集33-34
- 3.5.3 真实数据集34-36
- 3.6 小结36-37
- 第四章 基于演化算法的半监督序回归技术37-47
- 4.1 基于演化算法的半监督核判别分析序回归算法37-43
- 4.1.1 个体表示37-39
- 4.1.2 适应度函数39-40
- 4.1.3 差分进化40-43
- 4.2 实验验证43-45
- 4.2.1 实验设置43
- 4.2.2 处理大数据43-44
- 4.2.3 实验结果44-45
- 4.3 小结45-47
- 第五章 总结47-51
- 参考文献51-55
- 致谢55-57
- 在读期间发表的学术论文与取得的研究成果57
【相似文献】
中国期刊全文数据库 前10条
1 龚文引;谢丹;;针对本科生的演化算法教学探讨[J];计算机时代;2012年07期
2 熊盛武,李元香,康立山,陈毓屏;用演化算法求解抛物型方程扩散系数的识别问题[J];计算机学报;2000年03期
3 曾三友,康立山,丁立新;基于偏序关系的演化算法[J];计算机工程;2001年08期
4 周永华,毛宗源;基于混合杂交与间歇变异的演化算法[J];计算机工程与应用;2003年06期
5 闫震宇,康立山,陈毓屏,付朋辉;一种新的多目标演化算法——稳态淘汰演化算法[J];武汉大学学报(理学版);2003年01期
6 王涛,李歧强;基于空间收缩的并行演化算法[J];中国工程科学;2003年03期
7 何国良,李元香;多个粒子参与交叉的一种动态演化算法[J];计算机工程与应用;2004年08期
8 刘敏忠,邹秀芬,康立山;一种基于偏序排名的高效的多目标演化算法[J];小型微型计算机系统;2004年12期
9 王龙奎,汪祖柱;关于多目标演化算法的策略分析[J];安徽大学学报(自然科学版);2005年03期
10 田丽,林锦国,刘建峰,张光云;基于演化算法的客户关系管理系统研究[J];微处理机;2005年03期
中国重要会议论文全文数据库 前3条
1 冯珊;李锋;周凯波;;面向演化算法应用的智能体系统建模与仿真研究[A];西部开发与系统工程——中国系统工程学会第12届年会论文集[C];2002年
2 张文俊;谢晓锋;马君;;并行演化算法在半导体器件综合中的应用[A];2006年全国开放式分布与并行计算学术会议论文集(二)[C];2006年
3 谢柏桥;戴光明;郑蔚;王剑文;;有指导的多目标演化算法在区域星座设计中的应用[A];中国宇航学会深空探测技术专业委员会第四届学术年会论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 俞扬;演化计算理论分析与学习算法的研究[D];南京大学;2011年
2 库俊华;自适应差分演化算法及其应用研究[D];中国地质大学;2015年
3 彭晟;演化算法的静电场论模型[D];武汉大学;2011年
4 陈明;演化算法渐近行为的若干问题研究[D];武汉大学;2012年
5 彭飞;实值演化算法投资组合研究[D];中国科学技术大学;2011年
6 万书振;动态环境下差分演化算法研究与应用[D];武汉理工大学;2012年
7 魏波;交互式与自适应演化算法研究[D];武汉大学;2013年
8 赖鑫生;演化算法与混合算法的性能研究[D];华南理工大学;2014年
9 武志峰;差异演化算法及其应用研究[D];北京交通大学;2009年
10 陈天石;演化算法的计算复杂性研究[D];中国科学技术大学;2010年
中国硕士学位论文全文数据库 前10条
1 要婷婷;基于模因演化算法的有限容量弧路径问题研究[D];北京交通大学;2016年
2 邢雪;基于Pi演算的关系演化算法的研究与实现[D];吉林大学;2016年
3 戴志晃;一种基于熵量守恒的改进演化算法的研究[D];江西理工大学;2010年
4 潘伟丰;一种基于平均矢量偏差的仿生演化算法[D];江西理工大学;2008年
5 胡中波;差分演化算法及其在函数优化中的应用研究[D];武汉理工大学;2006年
6 李程俊;组合优化问题的并行演化算法研究[D];武汉理工大学;2003年
7 赵永翔;多目标差分演化算法的构造及其应用[D];武汉理工大学;2007年
8 张鑫;协同演化算法及其在组合投资中的研究与应用[D];哈尔滨工程大学;2011年
9 颜颖;异步分层并行演化算法及其在模糊聚类分析中的应用[D];厦门大学;2006年
10 程钢;基于差分演化算法的图像聚类研究[D];湖北工业大学;2015年
,本文编号:797699
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/797699.html