基于语义结构和视觉焦点的场景目标识别
本文关键词:基于语义结构和视觉焦点的场景目标识别,,由笔耕文化传播整理发布。
【摘要】:复杂场景中的目标检测以及识别一直都是机器视觉、人工智能、模式识别和图像处理领域的热点研究技术之一,并且被广泛的应用在军事科技、工业安防、日常生活、医疗气象等各个方面。像目前发展迅速的Google和百度的无人车、大疆创新开发的无人机、爱奇艺的视频广告投放、高新兴科技的智慧城市以及Magic Leap技术等,这些目标检测识别的应用与我们的生活如影随形。因此,提高复杂场景中目标的识别率和实时性就具有非常重要的意义。本文所做的改进工作主要包括以下两个方面。首先,经典的脉冲耦合神经网络(PCNN)+ITTI模型值虽然可以确定整个场景的目标物体,但是分离而出的目标物体中还会将背景图像也分离进去,并且无法将单个目标分别分离而出,因此会对后续要提取的特征向量有较大的影响,严重的影响了识别率。改进的MeanShift+ITTI模型,可以将整个目标分离而出,并且只带有少量的背景信息,实现了很好的目标物的分离,但是同样无法实现将多目标场景的分离。因此,本文提出了基于视觉焦点的改进ITTI模型,可以实现多目标复杂场景的目标物体分离,同时对于目标物与目标物之间的遮挡、粘连情况也具有较好的识别效果。其次,本文提出了将自然语言处理中的的语义机制应用于SVM分类器模型中,对于SVM分类不满足自然场景语义机制的打分,选取打分次高者作为判断的类别,并以此类推,使得重新进行目标识别后可以给出满足自然场景语义机制的识别结果,并且在时间上只有稍微的延时,同时,对识别率有了一定的提升。综上所述,本文提出的基于语义结构和视觉焦点的复杂场景目标检测识别技术具有自适应性好、识别率高、实时性好等特点。有望被各种目标识别技术应用和借鉴。
【关键词】:目标检测识别 语义结构 视觉焦点 可支持向量机 自然语言处理
【学位授予单位】:中北大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.41
【目录】:
- 摘要4-5
- abstract5-9
- 1.绪论9-19
- 1.1 课题研究背景及意义9-11
- 1.2 国内外研究现状11-17
- 1.2.1 国内研究现状12-15
- 1.2.2 国外研究现状15-17
- 1.3 主要研究内容及结构安排17-19
- 1.3.1 主要研究内容17-18
- 1.3.2 结构安排18-19
- 2.Gist+滤波器组构成的特征向量19-30
- 2.1 图像直方图基础19-20
- 2.2 LAB空间变换基础20-21
- 2.3 图像滤波基础21-27
- 2.3.1 高斯滤波22-24
- 2.3.2 高斯拉普拉斯滤波24-25
- 2.3.3 Gabor滤波25-27
- 2.4 Gist+滤波器组生成的特征向量提取27-29
- 2.5 本章小结29-30
- 3.改进的视觉注意力焦点模型30-46
- 3.1 传统的ITTI模型31-37
- 3.2 MeanShift+ITTI模型37-40
- 3.3 视觉焦点+ITTI模型40-42
- 3.4 各种算子定位结果比较42-44
- 3.5 本章小结44-46
- 4.语义机制改进的机器学习46-63
- 4.1 可支持向量机SVM51-57
- 4.2 Libsvm和Liblinear57-58
- 4.3 场景语义机制的SVM58-62
- 4.4 本章小结62-63
- 5.基于语义结构和视觉焦点的目标识别算法实现63-67
- 5.1 实验环境描述63
- 5.2 算法步骤流程63-64
- 5.3 实验仿真结果及分析64-66
- 5.4 本章小结66-67
- 6.总结与展望67-69
- 6.1 工作总结67
- 6.2 工作展望67-69
- 参考文献69-74
- 攻读硕士期间发表的论文及所取得的研究成果74-75
- 致谢75-76
【参考文献】
中国期刊全文数据库 前10条
1 周山;;计算机视觉艺术在数字媒体的应用[J];电子技术与软件工程;2016年03期
2 刘鹏飞;吴成茂;聂敏;;基于偏移场校正的模糊局部C-均值聚类算法[J];激光杂志;2015年10期
3 徐仲勋;黄科程;;机器视觉构造及应用综述[J];四川工程职业技术学院学报;2015年03期
4 夏永泉;JO Kang-hyun;甘勇;金保华;钱慎一;;计算机视觉在智能交通系统中的应用研究综述(英文)[J];郑州轻工业学院学报(自然科学版);2014年06期
5 杨梦铎;李凡长;张莉;;李群机器学习十年研究进展[J];计算机学报;2015年07期
6 顾轶凡;刘真;朱明;;基于高斯拉普拉斯算子的色域映射算法[J];包装工程;2014年09期
7 何清;李宁;罗文娟;史忠植;;大数据下的机器学习算法综述[J];模式识别与人工智能;2014年04期
8 卢文龙;王建军;刘晓军;;基于CUDA的高速并行高斯滤波算法[J];华中科技大学学报(自然科学版);2011年05期
9 贺颖;蒲晓蓉;;应用Gabor滤波的指纹识别算法的研究和实现[J];计算机工程与应用;2010年12期
10 卢旺盛;田增民;;机器人在外科领域应用现状[J];北京生物医学工程;2010年01期
中国博士学位论文全文数据库 前5条
1 汪启伟;图像直方图特征及其应用研究[D];中国科学技术大学;2014年
2 刘尚旺;基于改进选择性视觉注意模型的语义图像分割研究[D];西北农林科技大学;2012年
3 赵海峰;基于图的模式识别及其在计算机视觉中的应用[D];南京理工大学;2011年
4 刘R
本文编号:302791
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/302791.html