基于特征重构和样本筛选的迁移学习算法研究
发布时间:2022-01-12 05:45
随着大数据产业的迅猛发展,越来越多的产业需要对相关数据进行深入的分析,以期望从数据中获取有用信息,对业务流程进行建模,对业务效益进行评估,对业务趋势进行预测。在基于机器学习的业务流程建模过程中,数据一直是业务的核心,拥有质量较好的数据信息,就可以建立更好的数据模型。但是传统的机器学习仍然存在一些很棘手的问题:为了建立足够好的模型,建模过程需要足够多的有类别标签的样本数据,而往往有些数据非常难以获得,要获取相关的数据需要花费巨大的人力、物力和财力,甚至有时候获取某些领域的数据是不可能的。迁移学习作为一个新兴研究方向,可以将一个领域学习到的知识迁移到另外一个不同但却相关的领域,帮助另外一个领域进行快速建模。在迁移学习体系中,如何有效适配两个领域的数据分布,以及如何在领域之间的分布差异较小的情况下筛选出源领域的有效样本辅助目标领域模型的训练,都是影响目标领域数据模型有效性的关键因素。论文对基于实例的迁移学习算法和基于特征表达的迁移学习算法进行了分析,设计并验证了三种面向跨领域的迁移学习方法。首先,本文提出一个基于实例的简单迁移模型,模型通过对源领域数据进行一次非迭代的样本筛选,可以丰富目标域...
【文章来源】:云南大学云南省 211工程院校
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
图1-1传统机器学习和迁移学习的对比??
图1-2源域(红)和目标域(绿)数据分布不一致??
一实例迁移中混合沮峨的数据来辅助训练目标城的任务
【参考文献】:
期刊论文
[1]谷歌AutoML帮助不同企业建立人工智能系统[J]. 机床与液压. 2017(21)
[2]基于互信息的无监督特征选择[J]. 徐峻岭,周毓明,陈林,徐宝文. 计算机研究与发展. 2012(02)
[3]递归神经网络的结构研究[J]. 丛爽,戴谊. 计算机应用. 2004(08)
本文编号:3584216
【文章来源】:云南大学云南省 211工程院校
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
图1-1传统机器学习和迁移学习的对比??
图1-2源域(红)和目标域(绿)数据分布不一致??
一实例迁移中混合沮峨的数据来辅助训练目标城的任务
【参考文献】:
期刊论文
[1]谷歌AutoML帮助不同企业建立人工智能系统[J]. 机床与液压. 2017(21)
[2]基于互信息的无监督特征选择[J]. 徐峻岭,周毓明,陈林,徐宝文. 计算机研究与发展. 2012(02)
[3]递归神经网络的结构研究[J]. 丛爽,戴谊. 计算机应用. 2004(08)
本文编号:3584216
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3584216.html