基于视觉特征的二维图像文本描述生成关键算法研究

发布时间：2024-02-19 16:09

　　二维图像文本描述生成是人工智能领域的一个热门研究,是指利用机器学习、深度学习等方法和技术,生成能够描述图像视觉内容的文本语言,涉及了计算机视觉和自然语言处理。基于视觉特征的二维图像文本描述生成关键算法研究旨在通过特征提取、特征融合、语言生成等算法和技术,生成完整的、符合语法结构的文本句子,准确地描述出二维图像的视觉内容。二维图像文本描述生成对于场景理解具有重要意义,人类的交流过程大多依赖于自然语言,使计算机能够描述我们的视觉世界将会导致大量可能的应用,如图像检索、语义视觉搜索;人机交互中的视障辅助;智能监控中的道路监控等。近年来,虽然该领域的研究取得了长足的进步;但是仍然存在着一些亟待解决的问题,表现在以下几个方面:(1)已有研究中仅考虑使用图像层次的特征或粗粒度的属性特征,造成重要判别信息的损失。在基于注意力机制的二维图像文本描述生成方法中,注意力机制作为特征融合算法能够充分发挥作用的前提是已提取足够的视觉特征;而在基于属性的图像文本描述生成方法中使用的通常是粗粒度的属性特征。忽略了目标特征和细粒度属性信息的互补性。(2)已有研究中未考虑以粗粒度到细粒度的方式理解二维图像的视觉内容,...

【文章页数】：131 页

【学位级别】：博士

【部分图文】：

图１．３基于检索的图像文本描述生成方法示意图ｔ１６］??Ｆｉｇ．?１．３?Ｄｉａｇｒａｍ?ｏｆ?Ｒｅｔｒｉｅｖｅ－ｂａｓｅｄ?Ｍｅｔｈｏｄ?ｆｏｒ?Ｉｍａｇｅ?Ｄｅｓｃｒｉｐｔｉｏｎ?Ｇｅｎｅｒａｔｉｏ?

图１．７稠密文本描述生成示意图Ｗ??Ｆｉｇ．?１．７?Ｄｉａｇｒａｍ?ｏｆ?Ｄｅｎｓｅ?Ｄｅｓｃｒｉｐｔｉｏｎｓ?Ｇｅｎｅｒａｔｉｏｎ??

图1.8基于注意力的图像文本描述生成示意图[63]

图１．１０语义概念示意图［８９】??Ｆｉｇ．?１．１０?Ｄｉａｇｒａｍ?ｏｆ?Ｓｅｍａｎｔｉｃ?Ｃｏｎｃｅｐｔｓ??

本文编号：3902969

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/shengwushengchang/3902969.html

上一篇：基于知识图谱的社会媒体中少数民族主题数据抽取方法
下一篇：基于近红外光谱分析技术的纺织物纤维成分检测方法研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|