基于生成式对抗网络的图像标注方法研究
发布时间:2023-06-28 05:42
随着互联网技术的发展以及智能移动设备的快速普及,每天都会产生数以亿计的图像数据并且被各个用户上传到互联网,这些图像数据在大多杂乱无序的同时又包含着海量有用信息。为了对这些图像数据进行有效管理并高效利用其包含的有用信息,图像语义自动标注技术应运而生。目前,图像自动标注技术大多通过传统机器学习或者深度学习的方法构建标注模型实现对未知图像的自动标注。但是,这些标注方法大多都存在一个问题,即输出层的神经元(分类器)数目与数据集标注词汇量成比例,这将导致2个问题:1.模型实用性较差,当数据集词汇量较大时,过大的输出层数目将会急剧增加模型的设计和训练难度;2.模型结构稳定性差,模型结构会随词汇量变化而改变。针对上述问题,本文将生成式对抗网络与Word2vec词向量模型相结合,设计并实现了一种新的标注模型。首先,通过Word2vec模型将标注词汇映射为一个维数固定且可选择的多维词向量;其次,利用生成式对抗网络构建一个神经网络模型(GAN-W),使模型生成器的输出层神经元数目与多维词向量维数相等,生成器将生成与词向量同维度的向量,使模型输出层神经元数目与标注词汇量解绑;最后,对模型多次输出结果进行排序...
【文章页数】:58 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
1 绪论
1.1 论文研究背景和意义
1.2 国内外研究现状与发展
1.3 论文的研究内容及组织机构
2 关键基础技术研究
2.1 深度学习与卷积神经网络
2.2 生成式对抗网络
2.3 词向量模型
2.4 迁移学习
2.5 本章小结
3 基于GAN的标注模型结构
3.1 标注模型设计思想
3.2 标注模型整体结构
3.3 数据预处理
3.4 GAN网络训练模型
3.5 模型损失
3.6 测试模块
3.7 GAN模型训练算法
3.8 本章小结
4 模型实验及结果分析
4.1 实验数据集
4.2 评估方法
4.3 Word2vec模型训练参数对模型标注性能的影响
4.4 词向量维数对模型性能的影响
4.5 不同阈值对图像标注的影响
4.6 不同模型标注性能对比
4.7 模型实际标注效果
4.8 本章小结
5 总结与展望
致谢
参考文献
攻读硕士学位期间发表学术论文情况
本文编号:3836092
【文章页数】:58 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
1 绪论
1.1 论文研究背景和意义
1.2 国内外研究现状与发展
1.3 论文的研究内容及组织机构
2 关键基础技术研究
2.1 深度学习与卷积神经网络
2.2 生成式对抗网络
2.3 词向量模型
2.4 迁移学习
2.5 本章小结
3 基于GAN的标注模型结构
3.1 标注模型设计思想
3.2 标注模型整体结构
3.3 数据预处理
3.4 GAN网络训练模型
3.5 模型损失
3.6 测试模块
3.7 GAN模型训练算法
3.8 本章小结
4 模型实验及结果分析
4.1 实验数据集
4.2 评估方法
4.3 Word2vec模型训练参数对模型标注性能的影响
4.4 词向量维数对模型性能的影响
4.5 不同阈值对图像标注的影响
4.6 不同模型标注性能对比
4.7 模型实际标注效果
4.8 本章小结
5 总结与展望
致谢
参考文献
攻读硕士学位期间发表学术论文情况
本文编号:3836092
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3836092.html
最近更新
教材专著