基于半监督Tri-training的迁移学习算法研究
发布时间:2021-12-29 12:59
随着互联网、信息技术及存储技术的快速发展,数据量呈指数增长,获取大量有标记数据样本十分困难,而获取大量未标记数据样本相对容易。半监督学习和迁移学习都能够利用少量已标记数据和大量未标记数据进行训练学习,不需要大量的人力物力去获取有标签的数据,节省了时间和成本。然而,半监督学习在使用未标记数据时可能导致学习性能下降,而迁移学习领域自适应方法在维度约简过程中忽略了标签的依赖关系,也可能导致分类准确率降低。本文针对这些问题进行了改进,主要工作如下:(1)为了减小Tri-training算法在学习过程中产生的标记噪声对学习性能的影响,本文分别提出了一种基于交叉熵的Tri-training算法、一种安全的Tri-training学习算法、一个基于交叉熵的安全Tri-training学习框架。在提出的方法中,用交叉熵代替错误率来更好的反映模型预估结果和真实分布之间的差距,并结合凸优化方法降低了标记噪声,提高了伪标签的质量和模型的泛化性能。在UCI基准数据集验证了所提方法的有效性,并利用显著性检验从统计学的角度进一步验证了方法的性能。实验结果表明,所提出的半监督学习方法在分类性能方面优于传统的Tri-...
【文章来源】:辽宁师范大学辽宁省
【文章页数】:56 页
【学位级别】:硕士
【部分图文】:
不同数据分布的目标域数据
Caltech-256+Office-31数据集Fig.4.1Caltech-256+Office-31datasets
USPS+MNIST数据集Fig.4.2USPS+MNISTdatasets
【参考文献】:
期刊论文
[1]迁移学习研究进展[J]. 庄福振,罗平,何清,史忠植. 软件学报. 2015(01)
[2]基于分歧的半监督学习[J]. 周志华. 自动化学报. 2013(11)
本文编号:3556174
【文章来源】:辽宁师范大学辽宁省
【文章页数】:56 页
【学位级别】:硕士
【部分图文】:
不同数据分布的目标域数据
Caltech-256+Office-31数据集Fig.4.1Caltech-256+Office-31datasets
USPS+MNIST数据集Fig.4.2USPS+MNISTdatasets
【参考文献】:
期刊论文
[1]迁移学习研究进展[J]. 庄福振,罗平,何清,史忠植. 软件学报. 2015(01)
[2]基于分歧的半监督学习[J]. 周志华. 自动化学报. 2013(11)
本文编号:3556174
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3556174.html
最近更新
教材专著