当前位置:主页 > 科技论文 > 搜索引擎论文 >

图像自动标注算法研究

发布时间:2017-05-11 10:09

  本文关键词:图像自动标注算法研究,由笔耕文化传播整理发布。


【摘要】:随着互联网(Internet)的快速发展,图像的数量呈几何级数增长,如何从庞大的数据库有效地检索和管理图像是现在迫切需要解决的问题。目前,许多Internet公司都开发了他们自己的图像搜索引擎,但多数是采用基于文本的图像检索技术,然而其图像检索通常是人工进行标注的方式,既费时又费力。目前,基于内容的图像标注技术是利用图像中颜色、纹理、形状等底层特征进行相似性匹配,国内外也进行了大量相关的研究。但因该技术存在“语义鸿沟”的问题,制约了其对图像进行准确、快速标注。本文提出了一种基于联合特征选择的多示例图像语义自动标注方法。该方法通过训练图像的语义标签自动标注测试图像的标签。在此基础上,又对图像标注做了扩展,提出了基于最大熵模型的图像标签分布估计算法,即可以同时得到测试图像的标签及标签所占图像的比例(标签分布)。那么对图像标注和标签分布这两个方面,本文的研究内容包括:1.针对语义标注的不准确性,本文研究多示例学习方法在图像标注方面的应用。首先要对图像进行示例分割,并提取每个示例的底层特征。然后把这些示例的特征和标签输入到算法模型中学习。多示例学习既可以处理单标签也可以解决多标签图像自动标注问题。2.针对图像标签数量的有限性,本文研究半监督学习方法在图像标注方面的应用。从数据集中选取一部分有标签的样本,另一部分没有标签的样本,把它们一起作为训练样本进行学习。采用图拉普拉斯来解决半监督学习的问题,首先构建加权图,然后求得图拉普拉斯算子,最后代入流行正则化公式对目标函数进行优化。3.设计了一种基于联合特征选择的多示例多标签(Joint Feature Selection of Multi-instance Multi-lable,JFS-MIML)图像自动标注算法。在多示例学习的基础上对数据集进行半监督的学习,又利用流形学习的方法可以对特征维数高的数据进行降维处理。与此同时,本文又结合了稀疏表示构建了线性回归模型,最优化得到基于特征选择的多示例多标签图像自动标注算法。在训练得到预测值后,本文通过采取自适应阈值对预测值进行判定来得到标签,进而可求得图像标注的准确率。4.本文对图像标注进行了扩展,提出一种基于最大熵模型图像标签分布学习的方法。标签分布学习即可得到图像的标签,又可得到每张图像中标签的分布信息,进而知道在每幅图像中每种标签所占的比例,用户可优先选择所搜索标签中比例最大的图像,提高了图像检索准确率和合理性。在标签分布学习的启发下,本文把基于特征选择的多示例多标签图像自动标注算法应用在标签分布学习中,也得到了较好的结果。
【关键词】:图像标注 特征选择 多示例学习 流形学习 稀疏 标签分布
【学位授予单位】:中国计量学院
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.41
【目录】:
  • 致谢5-6
  • 摘要6-8
  • Abstract8-14
  • 1 绪论14-26
  • 1.1 课题背景和意义14-16
  • 1.2 国内外研究现状16-24
  • 1.2.1 基于概率统计模型的方法17-19
  • 1.2.2 关联文本法19-20
  • 1.2.3 分类法20-24
  • 1.3 研究内容和目标24-25
  • 1.4 本文组织结构25-26
  • 2 研究基础26-33
  • 2.1 引言26
  • 2.2 多示例学习26-30
  • 2.3 示例的分割30-31
  • 2.4 特征提取31-32
  • 2.5 本章小结32-33
  • 3 基于联合特征选择的多示例图像语义自动标注33-49
  • 3.1 引言33-34
  • 3.2 特征选择34-35
  • 3.3 半监督学习35-36
  • 3.4 基于流形学习的特征优化36-38
  • 3.4.1 主成分分析36-37
  • 3.4.2 局部线性嵌入37
  • 3.4.3 图拉普拉斯37-38
  • 3.5 稀疏表示38-39
  • 3.6 算法优化39-42
  • 3.7 实验42-44
  • 3.7.1 数据集42-43
  • 3.7.2 标签准确率判定43-44
  • 3.8 实验结果及分析44-47
  • 3.9 本章小结47-49
  • 4 基于最大熵模型的标签分布学习49-61
  • 4.1 引言49-50
  • 4.2 标签分布50-51
  • 4.3 算法51-55
  • 4.4 实验结果及分析55-59
  • 4.4.1 基于联合特征选择的标签分布学习55-57
  • 4.4.2 基于最大熵模型的标签分布学习57-59
  • 4.5 本章小结59-61
  • 5 总结与展望61-62
  • 参考文献62-66
  • 作者简历66

【相似文献】

中国期刊全文数据库 前10条

1 风吹雨;编程实现自动标注汉语拼音[J];电脑爱好者;2001年19期

2 尹文杰;韩军伟;郭雷;;图像与视频自动标注最新进展[J];计算机科学;2011年12期

3 孙茂松,卢红娜,邹嘉彦;基于隐Markov模型的汉语词类自动标注的实验研究[J];清华大学学报(自然科学版);2000年09期

4 钱玉森,陈立平,李战军,钟毅芳,周济;基于三维配筋的水工结构钢筋图自动标注研究[J];计算机辅助设计与图形学学报;2001年01期

5 周驰;丘宏扬;黄珍媛;;利用线性规划解决模具零件自动标注的尺寸重叠问题[J];锻压装备与制造技术;2007年06期

6 姚双云;胡金柱;舒江波;沈威;;篇章连贯语义关系的自动标注方法[J];计算机工程;2012年07期

7 郑泽芝;敖婷;;基于底表的多层扫描术语自动标注算法[J];厦门大学学报(自然科学版);2011年03期

8 黄昆;自动生成中线,自动标注拐点参数……[J];工程设计CAD及自动化;1998年03期

9 田枫;沈旭昆;杜睿山;周凯;;基于多特征标签相关性学习的图像自动标注[J];系统仿真学报;2013年02期

10 刘宝芹,施法中,唐卫清,黄永红;一种新的划分下钢结构节点图自动标注算法[J];计算机工程与应用;2002年12期

中国重要会议论文全文数据库 前6条

1 刘开瑛;陈雪艳;李济洪;;汉语框架元素自动标注实验报告[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

2 陈恋;周向东;叶剑烨;谢祖铭;张亮;施伯乐;;基于分层图像文档模型的图像语义自动标注[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年

3 吐尔根·依不拉音;阿里甫·库尔班;阿不都热依木;;基于词典的现代维吾尔语词性自动标注系统的研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年

4 杨新军;;基于三维设计的钢筋图自动标注研究[A];2004年水工专委会学术交流会议学术论文集[C];2004年

5 王斯日古楞;德·萨日娜;那顺乌日图;;现代蒙古语谓语段自动标注系统的设计与实现[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年

6 卢咪咪;谢磊;郑李磊;杨玉莲;张艳宁;;基于Alize工具包的广播音频播音员自动标注系统[A];第18届全国多媒体学术会议(NCMT2009)、第5届全国人机交互学术会议(CHCI2009)、第5届全国普适计算学术会议(PCC2009)论文集[C];2009年

中国博士学位论文全文数据库 前1条

1 王斌;图像检索中自动标注与快速相似搜索技术研究[D];中国科学技术大学;2007年

中国硕士学位论文全文数据库 前10条

1 何希圣;图像自动标注方法研究[D];复旦大学;2010年

2 李圣楠;基于自动标注训练集的微博语料情感分类的研究[D];东北师范大学;2013年

3 卓景文;基于主题分析的图像自动标注研究[D];安徽大学;2012年

4 张艳青;面向汉语拼音自动标注的现代汉语多音字词研究[D];河北大学;2011年

5 黄紫藤;动画角色自动标注方法研究[D];国防科学技术大学;2010年

6 史玉翡;用于信息抽取的自动标注技术研究[D];大连海事大学;2010年

7 陈雪艳;基于条件随机场的句法语义自动标注探索[D];山西大学;2009年

8 王晓明;基于多示例学习的跨场景图像自动标注研究[D];哈尔滨工业大学;2013年

9 代丽洁;自然场景图像的自动标注方法研究[D];哈尔滨工程大学;2010年

10 曲静;商品意见属性自动标注系统的设计与实现[D];电子科技大学;2013年


  本文关键词:图像自动标注算法研究,由笔耕文化传播整理发布。



本文编号:357025

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/357025.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d27d1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com