当前位置:主页 > 科技论文 > 矿业工程论文 >

图像语义描述技术研究及煤矿场景应用

发布时间:2021-02-11 09:16
  图像场景语义描述是计算机视觉和自然语言处理领域的交叉任务,其目标是对视觉数据给出语义解释,实现从视觉空间到语义空间的映射。视觉语义描述技术研究不仅在学术界成为热点,也在工业界得到越来越多的关注,具有广阔的应用前景,如对工业视频监控系统的智能化推进。当前,煤矿视频监控系统已经在井下普遍应用,但对于异常场景只是通过监控人员观察视频进行识别,然后采取应对措施解决,效率较低;并且其应用规模已远超人力观察范围,监控视频更多只用作事后取证,较多隐患问题不能早期识别与处理。将图像语义描述技术应用于煤矿监控视频系统可以实现煤矿视频监控在线智能化,大幅提升煤矿安全管理水平和事件处理效率。由于图像底层的视觉特征与高层的语义概念存在很大差异,目前的图像场景语义描述算法仍然存在较多不足,如确定图像的关注重点、挖掘更高层次的语义信息以及完善描述句子的细节信息等。因此本文针对图像语义描述技术存在的上述问题进行改进,提出基于Global-local Feature和Adaptive-attention图像语义描述算法,并将其应用于实际场景。本文的研究内容如下:(1)提出基于Global-local Feature和... 

【文章来源】:中国矿业大学江苏省 211工程院校 教育部直属院校

【文章页数】:79 页

【学位级别】:硕士

【部分图文】:

图像语义描述技术研究及煤矿场景应用


Sigmoid函数Figure2-3SigmoidfunctionTanh为双曲正切函数,取值范围为1~1,其主要由双曲正弦函数sinh

函数图像,函数,取值范围,双曲正弦函数


图 2-3 Sigmoid 函数Figure 2-3 Sigmoid function 为双曲正切函数,取值范围为 1 ~1,其主要由双曲正弦函数 cosh 组成,其函数表达式可以表示为:( ) ( )x xx xe ef x tanh xe e 函数图像如图 2-4 所示:

示意图,可视化,卷积,函数


图 2-5 ReLU 函数Figure 2-5 ReLU function视化网络可以学习图像的高级特征,Zeiler 等[12]提出反卷积神络模型提取的图像特征进行可视化。如图 2-6 所示,其为特征的特征可视化示意图,由图可以看出,随着卷积神经特征更为复杂、更为抽象,浅层神经网络提取的边缘、轮络提取的为抽象复杂的纹理信息。

【参考文献】:
期刊论文
[1]基于主成分分析网络的改进图像分类算法[J]. 赵小虎,尹良飞,朱亚楠,刘鹏,王学奎,沈雪茹.  激光与光电子学进展. 2019(02)
[2]图像的文本描述方法研究综述[J]. 马龙龙,韩先培,孙乐.  中文信息学报. 2018(04)
[3]基于全文检索的文本相似度算法应用研究[J]. 王格,吴钊,李向.  计算机与数字工程. 2016(04)
[4]智能分析预警技术在视频监控系统中的应用[J]. 陈贵平.  煤矿机械. 2014(02)
[5]基于视觉特性的井下图像去噪新方法[J]. 浦江,姜代红.  河北大学学报(自然科学版). 2014(01)

博士论文
[1]基于关注度机制的图像理解[D]. 郭聪.中国科学技术大学 2018
[2]煤矿监控图像拼接与识别的方法研究[D]. 姜代红.中国矿业大学 2015
[3]井下环境中运动目标检测与跟踪研究[D]. 张辰.中国矿业大学 2014

硕士论文
[1]基于深度学习的视觉内容描述技术研究[D]. 李林科.电子科技大学 2018
[2]基于语句相似度的中文文本复制检测技术研究[D]. 张慧云.北京邮电大学 2015
[3]基于链接文本相似度和时间因子的Web挖掘算法[D]. 李林洋.哈尔滨工程大学 2013
[4]基于快速相似度的Web结构挖掘的研究[D]. 马燕.南京信息工程大学 2011



本文编号:3028883

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/kuangye/3028883.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户78f65***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com