基于字典学习的跨媒体检索技术研究
发布时间:2023-04-02 09:13
多媒体数据在互联网上呈爆发式增长,对于多媒体数据处理的问题成为一个热门的研究领域。传统多媒体数据的研究多集中于对单模态的研究,其中包括图像检索,文本检索,音频检索以及视频的检索等,忽略了对多媒体间关联的分析。尽管现在有大量独立的可视图像和文本数据可用于多模态的研究,但其中只有一小部分与语义关联相联系,随着大数据时代的到来,信息量不断增加,数据共享变得越来越迫切,研究人员对分析不同模式间的数据相关性越来越感兴趣,出现了基于多媒体数据的跨模态检索技术研究。针对跨媒体检索的研究,由于不同模态数据的原始特征具有不同的物理意义和维度造成了异构性,另外不同模态的数据低级原始特征和高级语义间存在语义差距,导致了多媒体间相似性度量面临挑战。为解决这些问题,本文提出了两种基于子空间学习的跨媒体检索算法,在几种经典的数据集上验证其有效性。本文被总结如下两个方面:(1)提出一种基于线性判别分析的跨媒体检索算法(Cross-Media Retrieval based on Linear Discriminant Analysis)。该方法在子空间学习的基础上,利用文本特征的高判别性,通过相关性分析,将文本特征...
【文章页数】:46 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.3 研究内容及其创新点
1.4 章节概述及其组织框架
第二章 跨媒体检索研究的相关概述
2.1 引言
2.2 经典的跨媒体检索算法介绍
2.3 经典的跨媒体检索数据集介绍
2.4 评价指标
2.4.1 欧式距离(Euclidean Distance)
2.4.2 跨媒体检索的评价指标与衡量标准
2.5 本章小结
第三章 基于线性判别分析的跨媒体检索算法
3.1 引言
3.2 基于线性判别分析的跨媒体检索算法框架
3.2.1 目标函数
3.2.2 迭代优化
3.3 实验评估
3.3.1 参数设置
3.3.2 参数灵敏性分析
3.3.3 收敛性与复杂性分析
3.3.4 各组成分的有效性评估
3.4 本章小结
第四章 基于字典学习的跨媒体检索算法
4.1 引言
4.2 算法模型
4.2.1 图像检索文本
4.2.2 文本检索图像
4.3 优化
4.4 实验
4.5 结论
第五章 总结与展望
5.1 研究内容总结
5.2 下一步工作
参考文献
攻读硕士学位期间的主要成果
致谢
本文编号:3778963
【文章页数】:46 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.3 研究内容及其创新点
1.4 章节概述及其组织框架
第二章 跨媒体检索研究的相关概述
2.1 引言
2.2 经典的跨媒体检索算法介绍
2.3 经典的跨媒体检索数据集介绍
2.4 评价指标
2.4.1 欧式距离(Euclidean Distance)
2.4.2 跨媒体检索的评价指标与衡量标准
2.5 本章小结
第三章 基于线性判别分析的跨媒体检索算法
3.1 引言
3.2 基于线性判别分析的跨媒体检索算法框架
3.2.1 目标函数
3.2.2 迭代优化
3.3 实验评估
3.3.1 参数设置
3.3.2 参数灵敏性分析
3.3.3 收敛性与复杂性分析
3.3.4 各组成分的有效性评估
3.4 本章小结
第四章 基于字典学习的跨媒体检索算法
4.1 引言
4.2 算法模型
4.2.1 图像检索文本
4.2.2 文本检索图像
4.3 优化
4.4 实验
4.5 结论
第五章 总结与展望
5.1 研究内容总结
5.2 下一步工作
参考文献
攻读硕士学位期间的主要成果
致谢
本文编号:3778963
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3778963.html
最近更新
教材专著