基于深度学习的图片文字相关性计算算法研究与实现
发布时间:2018-03-28 10:05
本文选题:深度学习 切入点:计算机视觉 出处:《哈尔滨工业大学》2017年硕士论文
【摘要】:近年来,对于深度学习(Deep Learning,DL)技术逐渐引起工业界及学术界的广泛关注讨论,一方面相比传统机器学习模型,深度学习具备更强的表达能力,因而可以捕获更深层次的信息,从而取得更高的精度,另一方面,在计算机视觉领域,深度学习模型具备的自动对图像特征进行规约抽象的能力也逐渐取代了传统的基于经验的手工提取特征流程,降低了技术的门槛。自从2012年大放异彩至今,深度学习在计算机视觉领域及自然语言处理领域带来了一波又一波的浪潮,然而对于二者的交叉领域研究成果还比较有限,对于需要同时考虑图片信息及文本信息的业务场景深度学习仍有巨大的发挥潜力,本课题主要做了以下几方面的工作:(1)介绍了本课题的背景及研究意义,阐述了本课题使用深度学习算法的必要性,并简单概括总结了计算机视觉及自然语言处理的研究内容及发展历史;(2)针对深度学习在计算机视觉及自然语言处理领域的主要模型展开分析,对比了两个领域中一些常用的模型及其优缺点,为本课题的模型设计研究提供了启发参考。(3)从图片搜索日志中挖掘出了用于训练模型的高质量图片文本对数据,为本课题提供了数据基础,并设计实现了基于深度学习的图文相关性模型,同时针对模型细节进行优化,在验证集数据上测试模型效果。(4)本课题最终设计并提出了一个基于深度学习的图文相关性模型,为需要对图片与文字考量匹配度的场景提供了便利,并成功在图片搜索业务场景下发挥作用,有效提高了图片搜索引擎的排序能力,为用户带来了更好的搜索体验,这也更进一步佐证了深度学习模型在工业界的强大威力。
[Abstract]:This paper introduces the background and significance of deep learning in the field of computer vision and natural language processing .
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.41;TP181;TP391.1
【参考文献】
相关期刊论文 前6条
1 陈威;缑锦;;采用Haar小波与Gabor小波特征的级联式人脸检测方法[J];华侨大学学报(自然科学版);2011年05期
2 丁怡心;廖勇毅;;高斯模糊算法优化及实现[J];现代计算机(专业版);2010年08期
3 赵志宏;杨绍普;马增强;;基于卷积神经网络LeNet-5的车牌字符识别研究[J];系统仿真学报;2010年03期
4 袁春兰;熊宗龙;周雪花;彭小辉;;基于Sobel算子的图像边缘检测研究[J];激光与红外;2009年01期
5 窦建军,文俊,刘重庆;基于颜色直方图的图像检索技术[J];红外与激光工程;2005年01期
6 伯晓晨,刘建平;基于颜色直方图的图象检索[J];中国图象图形学报;1999年01期
,本文编号:1675860
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1675860.html