基于生成模型的视觉特征学习算法研究
发布时间:2021-01-10 18:53
图像作为对外界事物的客观描述,是现代生活中最常用的信息载体之一。图像处理技术在航空航天、工业检测等多个领域都有着重要的应用。视觉特征提取作为图像处理的基础,一直是研究者们重点关注的对象。生成模型学习输入数据的概率分布,能够将图像的本质特征描述出来,在各种应用场景中均取得了比手工设计的特征提取算法更好的效果。其中,传统的概率生成模型利用显式的函数模拟数据分布,函数的目标变量即为图像的特征。生成对抗网络能够将随机噪声映射到真实数据的分布空间中,得到高质量的合成图像,实现对数据概率密度的隐式表达。这两种生成模型都具有重要的研究与应用价值。本文首先详述了以专家乘积模型为代表的概率生成模型及其求解方法。由于生成对抗网络是基于深度学习的算法,本文分别对这两种理论进行介绍,作为之后研究工作的基础。对于图像版权保护问题,本文提出了一种基于多层生成模型的图像指纹算法。该算法利用一组专家函数将输入图像块映射为简短的特征描述符,并在目标函数中加入约束项以提高模型对不同视觉内容图像的区分性和对失真干扰的鲁棒性。算法采用均值池化去除特征图中的冗余,并将专家函数和池化级联构成一个特征提取模块。特征提取网络由多个模...
【文章来源】:天津大学天津市 211工程院校 985工程院校 教育部直属院校
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
各种算法的ROC曲线
第3章基于多层生成模型的鲁棒性图像指纹算法25表3-5各种算法在每种失真及所有失真下的1F指标失真类型本算法R-NMFCOMPSENWAVELETGF-DLVQSPARSELRSDSPA-STAJPEG压缩0.9990.9931.0001.0000.9950.9990.9990.981高斯噪声0.9990.9150.9980.9960.9550.9990.9990.952散斑噪声1.0000.9820.9990.9970.9760.9990.9990.991圆周滤波0.9890.8800.9970.9990.9100.9950.9920.810中值滤波0.9990.9820.9990.9990.9820.9980.9990.984旋转及截取0.9590.9980.9440.9880.9990.9590.9620.999直方图均衡化0.9980.8860.9850.8410.8890.9910.9950.876伽马校正0.9990.9790.9990.9410.9450.9990.9990.996比例放缩0.9970.9821.0000.9000.9940.9990.9990.896图3-4类内和类间指纹距离分布直方图3.3.2预训练及微调的作用本部分通过实验证明了基于概率生成模型的预训练过程的作用。实验采用新的训练策略:不使用预训练,直接通过微调对随机初始化的模型参数进行调整。表3-6给出了该策略下模型的性能,从中可以证明预训练的必要性。尽管该过程
第3章基于多层生成模型的鲁棒性图像指纹算法27图3-5改变池化操作所对应的ROC曲线3.3.4对于专家函数个数的选择这一部分中探讨了专家函数的个数对于算法性能的影响。3.3.1节中设置两层网络中分别包含有16和7个专家。由于第二层网络中的专家函数个数决定了所生成指纹的长度,因此本实验固定这一参数,改变第一层网络中专家函数的个数为7和24,并重新训练模型并进行测试。图3-6中显示了不同参数设置下得到的ROC曲线,结果证明当第一层网络选用16个专家函数时,算法能够实现最优性能。当函数个数减少为7时,算法性能出现了明显的降低,EER上升了67%(从1.03×10-2到1.72×10-2),说明过少的专家无法描述出图像块中的所有特征,不利于指纹的区分性。但这不代表增加专家函数的数量能够确保算法性能的稳定提升。如图3-6所示,将第一层网络参数设置为24得到的指纹测试结果不如将其设置为16的结果。一方面,增加专家函数的个数确实可以帮助提取到图像中更多的细节信息,有利于提高算法的区分性;但另一方面,细节特征往往对图像的失真变化更加敏感,将会对算法的鲁棒性造成不利影响。此外,本算法的训练时间与专家函数的个数成正比,增加专家函数的个数意味着网络的学习和计算指纹时间的延长,这也是在选择这一参数时需要考虑的因素。
本文编号:2969229
【文章来源】:天津大学天津市 211工程院校 985工程院校 教育部直属院校
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
各种算法的ROC曲线
第3章基于多层生成模型的鲁棒性图像指纹算法25表3-5各种算法在每种失真及所有失真下的1F指标失真类型本算法R-NMFCOMPSENWAVELETGF-DLVQSPARSELRSDSPA-STAJPEG压缩0.9990.9931.0001.0000.9950.9990.9990.981高斯噪声0.9990.9150.9980.9960.9550.9990.9990.952散斑噪声1.0000.9820.9990.9970.9760.9990.9990.991圆周滤波0.9890.8800.9970.9990.9100.9950.9920.810中值滤波0.9990.9820.9990.9990.9820.9980.9990.984旋转及截取0.9590.9980.9440.9880.9990.9590.9620.999直方图均衡化0.9980.8860.9850.8410.8890.9910.9950.876伽马校正0.9990.9790.9990.9410.9450.9990.9990.996比例放缩0.9970.9821.0000.9000.9940.9990.9990.896图3-4类内和类间指纹距离分布直方图3.3.2预训练及微调的作用本部分通过实验证明了基于概率生成模型的预训练过程的作用。实验采用新的训练策略:不使用预训练,直接通过微调对随机初始化的模型参数进行调整。表3-6给出了该策略下模型的性能,从中可以证明预训练的必要性。尽管该过程
第3章基于多层生成模型的鲁棒性图像指纹算法27图3-5改变池化操作所对应的ROC曲线3.3.4对于专家函数个数的选择这一部分中探讨了专家函数的个数对于算法性能的影响。3.3.1节中设置两层网络中分别包含有16和7个专家。由于第二层网络中的专家函数个数决定了所生成指纹的长度,因此本实验固定这一参数,改变第一层网络中专家函数的个数为7和24,并重新训练模型并进行测试。图3-6中显示了不同参数设置下得到的ROC曲线,结果证明当第一层网络选用16个专家函数时,算法能够实现最优性能。当函数个数减少为7时,算法性能出现了明显的降低,EER上升了67%(从1.03×10-2到1.72×10-2),说明过少的专家无法描述出图像块中的所有特征,不利于指纹的区分性。但这不代表增加专家函数的数量能够确保算法性能的稳定提升。如图3-6所示,将第一层网络参数设置为24得到的指纹测试结果不如将其设置为16的结果。一方面,增加专家函数的个数确实可以帮助提取到图像中更多的细节信息,有利于提高算法的区分性;但另一方面,细节特征往往对图像的失真变化更加敏感,将会对算法的鲁棒性造成不利影响。此外,本算法的训练时间与专家函数的个数成正比,增加专家函数的个数意味着网络的学习和计算指纹时间的延长,这也是在选择这一参数时需要考虑的因素。
本文编号:2969229
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2969229.html