基于特征学习的多示例多标记学习研究
发布时间:2017-04-01 15:16
本文关键词:基于特征学习的多示例多标记学习研究,由笔耕文化传播整理发布。
【摘要】:随着互联网和多媒体技术的迅速发展,每天都有海量的数据产生,其中就包含着海量的图像、文本等数据,如何有效地利用和管理这类图像、文本数据,日益成为科研和商业需要解决的一个问题。对于这些海量的图像、文本等数据,数据呈现出给我们的不再是简单的单一的内容形式,现实生活中呈现出的更多是具有复杂内容的多义性的样本数据,如何有效地处理这类多义性样本数据,是当前科研的一个难点。在处理具有复杂内容的多义性对象时,一种比较有效的处理方法是多示例多标记学习方法。在这种方法下,用多示例的方法来表示样本数据的复杂内容,用多标记的方法来表示样本数据的多个语义,通过提取示例的特征,对特征和标记之间建立模型,从而达到识别多语义样本数据的目的。然而,在建立算法模型时,提取什么样的特征,怎么来表示提取的特征,从根源上关系到多示例多标学习方法的识别效果。基于这一点,本文根据现有的底层特征提取方法、中层语义特征提取方法、特征学习如深度学习技术等,将这些技术融入到多示例多标记学习方法中,提出了一种通用的多示例多标记学习框架模型。本文的主要研究内容如下:(1)通过研究特征学习技术、多示例多标记学习技术等,挖掘算法中的不足,在现有理论方法的基础上,将特征学习技术融入到多示例多标记学习中,提出了一种通用的多示例多标记学习框架,该模型框架可以很好地改善现有多示例多标记学习方法中的不足。(2)在通用模型框架的基础上,提出了一种基于主题模型的多示例多标记学习方法(CPNMIML),在该方法中,算法的特征学习模型采用的是概率潜在语义分析模型(PLSA),该特征学习模型是一种浅层的特征学习模型,其特征学习的能力有限,因此,基于卷积神经网络的多示例多标记学习方法(CNNMIML)应用而生,卷积神经网络是深度学习的一种模型,具备良好的特征学习能力。在多示例多标记学习方法中,研究者已经提出了很多算法,而MIMLBOOST和MIMLSVN是两个比较典型的算法,因此,在进行实验结果对比时,本文将提出的方法和MIMLBOOST和MIMLSVN这两种方法分别进行了比较,在基准数据集上进行实验,结果表明,本文提出的方法在性能上都比MIMLBOOST和MIMLSVN好。
【关键词】:特征学习 多示例多标记学习 主题模型 深度学习 人工神经网络 卷积神经网络 场景分类 文本分类
【学位授予单位】:广西师范大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.41
【目录】:
- 摘要3-4
- Abstract4-8
- 第1章 绪论8-11
- 1.1 研究背景及意义8
- 1.2 当前研究现状8-10
- 1.3 文章主要内容与结构10-11
- 第2章 特征学习及多示例多标记学习技术11-22
- 2.1 特征学习11-14
- 2.1.1 图像底层特征11-14
- 2.2 多示例多标记学习技术14-21
- 2.2.1 多标记映射方法16-21
- 2.3 本章小结21-22
- 第3章 基于主题模型的多示例多标记学习(CPNMIML)方法22-34
- 3.1 相关工作22-24
- 3.1.1 多示例学习方法22-23
- 3.1.2 多标记学习方法23
- 3.1.3 多示例多标记学习方法23-24
- 3.2 CPNMIML算法24-27
- 3.2.1 概率潜在语义分析24-25
- 3.2.2 神经网络25
- 3.2.3 算法流程25-27
- 3.3 实验结果与分析27-32
- 3.3.1 实验步骤27-29
- 3.3.2 实验结果29-32
- 3.4 本章小结32-34
- 第4章 基于卷积神经网络的多示例多标记学习(CNNMIML)方法34-41
- 4.1 卷积神经网络(CNN)34-36
- 4.1.1 卷积神经网络理论34-35
- 4.1.2 卷积神经网络结构35
- 4.1.3 一种典型的卷积神经网络结构(LeNet-5)35-36
- 4.2 CNNMIML算法36-38
- 4.3 实验结果比较与分析38-40
- 4.4 本章小结40-41
- 第5章 总结与展望41-42
- 5.1 总结41
- 5.2 展望41-42
- 参考文献42-45
- 攻读硕士期间的科研成果45-46
- 致谢46-47
本文关键词:基于特征学习的多示例多标记学习研究,,由笔耕文化传播整理发布。
本文编号:280855
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/280855.html