迁移学习分类技术及应用研究
发布时间:2021-07-21 23:46
计算机科学和互联网的发展,使得数据挖掘与机器学习技术得到空前关注。多数机器学习算法依赖于有标记数据,而人工标注成本较高,许多应用中缺少有标记数据,迁移学习技术应运而生。本文主要研究了迁移学习中的零样本学习方法,迁移学习技术在未知雷达辐射源识别中的应用以及强化学习在雷达干扰决策中的应用。首先,本文研究了基于线性兼容性函数的零样本学习算法。通过使用考虑了类别差异的损失函数,并且加入直推式的局部学习算法进一步修正模型。现有的基于线性兼容性函数的零样本学习算法的损失函数对错分给不同类别以相同的损失,忽略了不同类别之间存在的差异。因此,使用差异化的损失函数可以使源域模型能够更好地适应目标域的分类任务。然后引入直推式的局部学习方法,利用目标域样本潜在的分布信息与结构特点,减少投影域漂移问题带来的影响,从而提高分类效果。实验表明,改进后的算法分类性能有一定的提升,局部学习方法可以显著提高分类准确率。其次,研究了基于迁移成分分析的未知雷达辐射源识别方法。本文首先对未知雷达辐射源识别问题进行了分析,通过专家知识将已知雷达辐射源和未知雷达辐射源联系起来,用基于高斯混合模型的新类别检测方法将测试样本中的已知...
【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校
【文章页数】:78 页
【学位级别】:硕士
【部分图文】:
动物属性数据集图像示例
如图 2.1 是一个域适应的示意图。源域空间 共享空间目标域空间图2.1 域适应示意图2.4 强化学习强化学习(Reinforcement Learning,RL)是的概念最早由 Minsky 于 1954 提出,逐渐成为机器学习中的热点研究方向,并广泛应用于各种智能控制、决策分析等现实应用中。强化学习能够让机器通过奖励和惩罚自主地学会完成任务。强化学习所面对的问题是一个机器如何在一个动态的环境中用试错的方式学习行为,处理这类问题的方法主要有两种。一种是在动作空间中搜索能够在环境中获得最好表现的动作,这种方法通常使用遗传算法等智能搜索算法来求解。另一种方法用统计方法和动态规划方法来估计采取动作带来的效用。第二种方法是研究的主流,因为它利用了强化学习问题的特殊结构[48]。强化学习的任务通常可以用马尔科夫决策过程(Markov Decision Process,MDP)来表示。马尔科夫决策过程可以用一个四元组 S , A, P, R 来描述。其中
图3.3 aPY 数据集图像示例[51]中,包含了来自PASCALVOC2008数据集的20oo 数据集的 12 个类别的 2644 幅图像,每幅图像有
本文编号:3296004
【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校
【文章页数】:78 页
【学位级别】:硕士
【部分图文】:
动物属性数据集图像示例
如图 2.1 是一个域适应的示意图。源域空间 共享空间目标域空间图2.1 域适应示意图2.4 强化学习强化学习(Reinforcement Learning,RL)是的概念最早由 Minsky 于 1954 提出,逐渐成为机器学习中的热点研究方向,并广泛应用于各种智能控制、决策分析等现实应用中。强化学习能够让机器通过奖励和惩罚自主地学会完成任务。强化学习所面对的问题是一个机器如何在一个动态的环境中用试错的方式学习行为,处理这类问题的方法主要有两种。一种是在动作空间中搜索能够在环境中获得最好表现的动作,这种方法通常使用遗传算法等智能搜索算法来求解。另一种方法用统计方法和动态规划方法来估计采取动作带来的效用。第二种方法是研究的主流,因为它利用了强化学习问题的特殊结构[48]。强化学习的任务通常可以用马尔科夫决策过程(Markov Decision Process,MDP)来表示。马尔科夫决策过程可以用一个四元组 S , A, P, R 来描述。其中
图3.3 aPY 数据集图像示例[51]中,包含了来自PASCALVOC2008数据集的20oo 数据集的 12 个类别的 2644 幅图像,每幅图像有
本文编号:3296004
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3296004.html