机器学习中原型学习理论与方法研究

发布时间:2021-08-05 02:59
  随着信息技术在社会各领域的深入渗透,人类社会所拥有的数据总量达到了一个前所未有的高度。一方面,海量数据为基于数据驱动的机器学习方法获取有价值信息提供了充分空间;另一方面,高维度、过冗余以及高噪声也是上述繁多、复杂数据的固有特性。为消除数据冗余、发现数据结构、提高数据质量,原型学习是一种行之有效的方式。通过寻找一个原型集来表示目标集,以从样本空间进行数据约简,在增强数据可用性的同时,提升机器学习算法的执行效率。其可行性在众多应用领域中已得到证明。因此,开展原型学习相关理论与方法的研究具有重要的理论意义和应用价值。本文围绕原型学习中的多样性、可解释性和相容性三个核心问题,探索建立新的原型学习模型,对涉及的相似性度量、互斥约束、质量评价、知识迁移、模型优化等理论问题开展深入研究,解决面向表征学习的原型互斥选择、原型结构化选择、任务指派中的原型生成等技术问题。论文的主要创新性研究成果包括:?提出了一种特征聚合中的原型选择方法。为了产生紧致但可解释的全局表示,该方法通过松弛排他性约束从所有局部特征中选取信息密度高、相容性强的原型。同时,将特征聚合中的码书构建、编码以及池化有效地集成到一个统一的原... 

【文章来源】:北京交通大学北京市 211工程院校 教育部直属院校

【文章页数】:146 页

【学位级别】:博士

【文章目录】:
致谢
中文摘要
ABSTRACT
主要符号对照表
1 绪论
    1.1 研究背景与意义
    1.2 国内外研究概况
        1.2.1 原型学习的相关方法
        1.2.2 原型学习的典型应用
        1.2.3 原型质量评估
    1.3 研究内容和论文框架
        1.3.1 研究内容
        1.3.2 论文框架与结构安排
2 原型学习综述
    2.1 原型学习的监督方式
        2.1.1 无监督的原型学习
        2.1.2 半监督的原型学习
        2.1.3 全监督的原型学习
    2.2 原型学习的相关模型
        2.2.1 基于相似度的原型学习
        2.2.2 基于行列式点过程的原型选择
        2.2.3 基于数据重构的原型学习
        2.2.4 基于低秩逼近的原型选择
    2.3 本章小结
3 特征聚合中的原型选择
    3.1 问题描述
    3.2 面向特征聚合的原型选择方法
        3.2.1 原型诱导的特征聚合模型建立
        3.2.2 半监督下的特征聚合
    3.3 模型求解
        3.3.1 优化解法的框架
        3.3.2 收敛性分析
        3.3.3 计算复杂度分析
    3.4 实验结果和分析
        3.4.1 实验设置
        3.4.2 合成数据的定性评估
        3.4.3 图像检索的性能评估
        3.4.4 图像分类的性能评估
        3.4.5 Pro LFA的参数敏感度
        3.4.6 Pro LFA的可扩展性
    3.5 本章小结
4 面向任务指派的原型生成
    4.1 问题描述
    4.2基础指派模型DS3
    4.3 面向任务指派的原型生成方法
        4.3.1 通用指派模型建立
        4.3.2 无监督下的原型生成
        4.3.3 半监督下的原型生成
        4.3.4 全监督下的原型生成
    4.4 模型求解
        4.4.1 优化解法的框架
        4.4.2 收敛性分析
        4.4.3 计算复杂度分析
    4.5 实验结果和分析
        4.5.1 运动分割性能的分析
        4.5.2 动作识别性能的分析
        4.5.3 场景分类性能的分析
        4.5.4 GAM的参数敏感度
        4.5.5 算法的收敛速度
    4.6 本章小结
5 l_1范数度量诱导的原型选择
    5.1 问题描述
    5.2 f_1范数度量诱导的原型选择模型
        5.2.1 原型选择模型建立
        5.2.2 原型在线选择
    5.3 模型求解
        5.3.1 子问题Ψ_S的解法
        5.3.2 子问题Φ_Z的解法
        5.3.3 收敛性分析
        5.3.4 计算复杂度分析
    5.4 实验结果和分析
        5.4.1 实验设置
        5.4.2 合成数据的定性评估
        5.4.3 视频摘要的性能评估
        5.4.4 运动分割的性能评估
        5.4.5 场景分类的性能评估
    5.5 本章小结
6 自监督的深度低秩原型选择
    6.1 问题描述
    6.2 自监督的深度低秩原型选择框架
    6.3 模型求解
        6.3.1 子问题P1的解法
        6.3.2 子问题P2的解法
        6.3.3 提出解法的概述
        6.3.4 计算复杂度分析
    6.4 实验结果和分析
        6.4.1 视频摘要的性能评估
        6.4.2 文本聚类的性能评估
        6.4.3 图像分类的性能评估
        6.4.4 SDLA的噪声敏感度
    6.5 本章小结
7 基于知识迁移的原型生成
    7.1 问题描述
    7.2 基于知识迁移的原型生成方法
        7.2.1 基于知识迁移的原型生成定义
        7.2.2 层次化原型生成模型建立
    7.3 模型求解
        7.3.1 提出解法的框架
        7.3.2 算法收敛性分析
        7.3.3 计算复杂度分析
    7.4 实验结果和分析
        7.4.1 实验设置
        7.4.2 实验A:无交叉类问题的性能评估
        7.4.3 实验B:有交叉类问题的性能评估
        7.4.4 HPG的参数敏感度
    7.5 本章小结
8 总结与展望
    8.1 工作总结
    8.2 未来工作展望
参考文献
作者简历
攻读博士学位期间发表的学术论文
学位论文数据集


【参考文献】:
博士论文
[1]模式识别中的样本选择研究及其应用[D]. 姜文瀚.南京理工大学 2008
[2]基于粗糙集的数据约简及粗糙集扩展模型的研究[D]. 邓大勇.北京交通大学 2007



本文编号:3322923

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/3322923.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户6e065***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com