当前位置:主页 > 科技论文 > 搜索引擎论文 >

图像与视频自动语义标注方法研究

发布时间:2019-05-30 18:06
【摘要】:基于文本检索的成熟技术来解决图像检索的问题已经取得了很大成功,像Google和Baidu等商业搜索引擎都已推出了自己的基于文本的图像检索服务。但是遗憾的是,互联网上大规模的数字媒体中仅有非常少量的数据是带有文本标签和文字描述的,而且数据还在快速增加。为了更好的管理和利用这些数据,让这些信息丰富的数据发挥更大的价值,对图像和视频的语义提取成为了近年研究的热点。过去十年,基于统计模型和分类模型提出了多种解决方案,但是都没有达到令人满意的效果。 多示例多标签学习(MIML)是近年才出现的一种新的学习框架,由于其对多义性对象的出色表达能力而被运用到图像分类和标注任务中。MIML将样本看作由多个示例组成的示例包,并将其与多个语义标注关联。与传统的学习技术相比,MIML对多语义的复杂物体的表示更自然,而实验也表明MEML在图像场景分类等问题上都比传统的学习技术有更好的效果。MIML中对图像的多示例表示是解决图像多义性表达的关键,其生成方式对标注结果有重要的影响。本文分析比较了基于区域和基于网格的两种图像多示例生成方式,并采用一种新的图像分割算法进行基于区域的多示例生成。图像的多示例表示加大了图像间相似度的计算复杂度,本文采用一种多示例核函数来度量多示例数据的相似性,在不损失其多义性表示的基础上降低了计算复杂度。 视频标注作为图像标注的延伸近年得到广泛研究,大多数方法都是将视频看作一组关键帧图像的组合,从而借鉴图像标注的理论方法来解决视频标注的问题,也取得了不错的效果。但是经典的图像标注方法没有时间维度,而时间维度是视频中很重要的信息。视频中一个镜头往往是描述同一个语义,即这个镜头中的所有帧图像的语义概念都是相同的,所以考虑视频的时间维度将会大大提高视频标注的准确度。本文同样将视频看作一组关键帧图像的组合对视频的自动标注进行了研究,并考虑视频中的时间维度,提出一种基于时间一致性的核函数提高视频标注的准确性。另外,为了提高模型的标注准确性和泛化能力,本文还探索了集成学习在图像和视频自动标注的应用。 本文主要做了一下几个方面的研究:1)分析现有的基于多示例的图像标注算法,探索比较了两种多示例生成方法对结果的影响。2)提出一种基于MIML框架解决图像标注的问题的方法,我们首先采用一种新的图像分割方式提取图像的多示例表示,并采用多示例核函数度量其相似性,然后提出一个基于多种特征的集成学习算法。3)提出一种基于时间一致性的核函数,充分利用视频中关键帧之间的时间一致性提高视频标注的准确性。为了验证算法的有效性,本文将在Corel5k数据集,IAPR数据集和TRECVID2005视频分别验证图像和视频的标注算法。实验结果表明,我们的算法有效改善了图像和视频标注的准确性。
[Abstract]:......
【学位授予单位】:山东大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TP391.41

【共引文献】

相关期刊论文 前10条

1 韩强;;基于广义Hough变换的手写文档整词定位[J];安徽电子信息职业技术学院学报;2011年05期

2 杨绪兵,韩自存;ε不敏感的核Adaline算法及其在图像去噪中的应用[J];安徽工程科技学院学报(自然科学版);2003年04期

3 陶秀凤,唐诗忠,周鸣争;基于支持向量机的软测量模型及应用[J];安徽工程科技学院学报(自然科学版);2004年02期

4 许高程;张文君;王卫红;;支持向量机技术在遥感影像滑坡体提取中的应用[J];安徽农业科学;2009年06期

5 郭立萍;唐家奎;米素娟;张成雯;赵理君;;基于支持向量机遥感图像融合分类方法研究进展[J];安徽农业科学;2010年17期

6 程刚;郑小华;阳锋;徐祖舰;;三维全景视觉技术在农业机器人中的应用[J];安徽农业科学;2010年34期

7 冯学军;;最小二乘支持向量机的研究与应用[J];安庆师范学院学报(自然科学版);2009年01期

8 何海燕;施培蓓;;基于改进AdaBoost算法的行人检测方法[J];安庆师范学院学报(自然科学版);2009年03期

9 吴慧兰;刘国栋;刘炳国;胡涛;浦昭邦;;ICF实验靶定位技术研究[J];半导体光电;2008年05期

10 邹心遥;姚若河;;基于LSSVM的威布尔分布形状参数估计(英文)[J];半导体技术;2008年06期

相关会议论文 前10条

1 ;An effective procedure exploiting unlabeled data to build monitoring system[A];中国科学院地质与地球物理研究所第11届(2011年度)学术年会论文集(下)[C];2012年

2 刘善磊;张亮;;基于相位相关和SURF算法的关键帧实时匹配研究[A];江苏省测绘学会2011年学术年会论文集[C];2011年

3 隋树林;孙立宏;姚文龙;袁健;;融合改进UKF/SIFT信息的自主光学导航方法[A];第二十六届中国控制会议论文集[C];2007年

4 ;A Novel Kernel PCA Support Vector Machine Algorithm with Feature Transition Function[A];第二十六届中国控制会议论文集[C];2007年

5 ;A Novel Proximal Support Vector Machine and Its Application in Radar Target Recognition[A];第二十六届中国控制会议论文集[C];2007年

6 汪力;叶桦;夏良正;;利用特征点定位嘴巴[A];第二十六届中国控制会议论文集[C];2007年

7 ;Loop-closing By Using SIFT Features for Mobile Robots[A];第二十六届中国控制会议论文集[C];2007年

8 ;Fault Pattern Recognition of Rolling Bearings Based on Wavelet Packet and Support Vector Machine[A];第二十七届中国控制会议论文集[C];2008年

9 周凯;范瑞霞;李位星;;一种基于SIFT的MeanShift-粒子滤波融合跟踪算法[A];第二十九届中国控制会议论文集[C];2010年

10 ;Rapid Target Recognition and Tracking under Large Scale Variation Using Semi-Naive Bayesian[A];第二十九届中国控制会议论文集[C];2010年

相关博士学位论文 前10条

1 王玉全;基于全景视觉的移动机器人同时定位与地图创建方法研究[D];哈尔滨工程大学;2010年

2 梁洪;基于内容的医学图像检索及语义建模关键技术研究[D];哈尔滨工程大学;2010年

3 任桢;图像分类任务的关键技术研究[D];哈尔滨工程大学;2010年

4 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年

5 孔凡芝;引线键合视觉检测关键技术研究[D];哈尔滨工程大学;2009年

6 王作为;具有认知能力的智能机器人行为学习方法研究[D];哈尔滨工程大学;2010年

7 郑大腾;柔性坐标测量机空间误差模型及最佳测量区研究[D];合肥工业大学;2010年

8 肖洁;视觉注意模型及其在目标感知中的应用研究[D];华中科技大学;2010年

9 朱清波;序列图像三维重建方法研究[D];华中科技大学;2010年

10 田文;多视图图像的快速三维场景重建[D];华中科技大学;2010年

相关硕士学位论文 前10条

1 宋抗;压缩机活塞圆度误差数字检测系统研究[D];河南理工大学;2010年

2 陈忠翔;基于立体视觉的三维重建方法研究[D];南昌航空大学;2010年

3 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年

4 雒燕飞;地质灾害应急地理信息数据库设计及其应用[D];山东科技大学;2010年

5 唐红梅;基于辐射与空间信息的遥感图像检索[D];山东科技大学;2010年

6 倪希亮;基于尺度不变特征的多源遥感影像配准[D];山东科技大学;2010年

7 贾伟洁;SAR影像与光学影像配准研究[D];山东科技大学;2010年

8 朱耿峰;支持向量机在冲击地压预测模型中的应用研究[D];山东科技大学;2010年

9 任天宇;自稳定航拍系统算法与设计[D];长春理工大学;2010年

10 韩宁;鲁棒性图像水印算法研究[D];辽宁师范大学;2010年



本文编号:2489055

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2489055.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户bc90b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com