融合语义知识的深度表达学习及在视觉理解中的应用
本文选题:深度学习 + 神经网络 ; 参考:《计算机研究与发展》2017年06期
【摘要】:近几年来,随着深度学习技术的日趋完善,传统的计算机视觉任务得到了前所未有的发展.如何将传统视觉研究中的领域知识融入到深度模型中提升深度模型的视觉表达能力,从而应对更为复杂的视觉任务,成为了学术界广泛关注的问题.鉴于此,以融合了语义知识的深度表达学习为主线展开了一系列研究.取得的主要创新成果包括3个方面:1)研究了将单类型的语义信息(类别相似性)融入到深度特征的学习中,提出了嵌入正则化语义关联的深度Hash学习方法,并将其应用于图像的相似性比对与检索问题中,取得了较大的性能提升;2)研究了将多类型信息(多重上下文信息)融入到深度特征的学习中,提出了基于长短期记忆神经网络的场景上下文学习方法,并将其应用于复杂场景的几何属性分析问题中;3)研究了将视觉数据的结构化语义配置融入到深度表达的学习中,提出了融合语法知识的表达学习方法,并将其应用到复杂场景下的通用内容解析问题中.相关的实验结果表明:该方法能有效地对场景的结构化配置进行预测.
[Abstract]:In recent years, with the improvement of deep learning technology, the traditional computer vision task has been developed unprecedented. How to integrate the domain knowledge of traditional visual research into the depth model to enhance the visual expression ability of the depth model, so as to deal with more complex visual tasks, has become a widespread concern in the academic community. In view of this, a series of researches are carried out based on the deep representation learning of semantic knowledge. The main innovation results obtained include three aspects: 1) this paper studies the integration of single-type semantic information (category similarity) into the learning of depth features, and proposes a method of deep Hash learning with embedded regularized semantic association. It is applied to the similarity comparison and retrieval of images, and a great performance improvement is achieved. (2) the multi-type information (multi-context information) is integrated into the depth feature learning. A scene context learning method based on short and long memory neural networks is proposed and applied to the geometric attribute analysis of complex scenes. (3) the structural semantic configuration of visual data is integrated into the learning of deep representation. This paper proposes a representation learning method of fusion grammar knowledge and applies it to the general content resolution problem in complex scenarios. The experimental results show that the proposed method can effectively predict the structured configuration of the scene.
【作者单位】: 中山大学数据科学与计算机学院;
【基金】:国家自然科学基金优秀青年科学基金项目(6162200366)~~
【分类号】:TP18;TP391.41
【相似文献】
相关期刊论文 前10条
1 高永建 ,吴健康;神经网络及其识别应用简介[J];电信科学;1990年02期
2 谢国梁;;神经网络:从希望到现实[J];激光与光电子学进展;1991年01期
3 郑士贵;文献自动阅读神经网络[J];管理科学文摘;1996年08期
4 吕芬;赵生妹;;基于Hopfield神经网络的噪声字母识别[J];计算机与信息技术;2005年12期
5 李毅;童红俊;宋贵宝;李冬;;神经网络在飞行器航迹仿真计算中的应用[J];海军航空工程学院学报;2006年05期
6 林钢;;基于SOM神经网络对潜在客户的挖掘[J];南宁职业技术学院学报;2006年04期
7 杨帆;陈劲杰;唐梅华;陈鑫;;简论神经网络在搜索中的应用[J];机械管理开发;2008年01期
8 朱红斌;;LVQ神经网络在交通事件检测中的应用[J];计算机工程与应用;2008年34期
9 李彤岩;李兴明;;神经网络在确定关联规则挖掘算法权值中的应用研究[J];计算机应用研究;2008年05期
10 石文渊;彭军民;;基于神经网络的货币识别研究[J];西安理工大学学报;2008年02期
相关会议论文 前10条
1 陈文新;王长富;戴蓓倩;;基于神经网络的汉语四声识别[A];第一届全国语言识别学术报告与展示会论文集[C];1990年
2 李睿;李明军;;一种模糊高斯基神经网络在数值逼近上的仿真[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年
3 许旭萍;臧道青;;采用Hopfield神经网络实施缸盖表面点阵字符识别[A];第十五届全国汽车检测技术年会论文集[C];2011年
4 朱长春;;神经网络用于线性时固有系统的广义状态转移矩阵的识别[A];中国工程物理研究院科技年报(1999)[C];1999年
5 王玉斌;李永明;王颖;;用数据挖掘和神经网络技术预测工程造价[A];第十一届全国电工数学学术年会论文集[C];2007年
6 应捷;袁一方;;神经网络指纹特征点匹配算法的改进[A];2007'中国仪器仪表与测控技术交流大会论文集(二)[C];2007年
7 谢小良;符卓;;基于Hopfield神经网络的单周期船舶调度模型及算法[A];2008年全国开放式分布与并行计算机学术会议论文集(下册)[C];2008年
8 陈意;;神经网络在船舶识别一个应用[A];船舶航泊安全的新经验新技术论文集(上册)[C];2007年
9 王辉;杨杰;黎明;蔡念;;一种基于神经网络的图像复原方法[A];2006年全国光电技术学术交流会会议文集(D 光电信息处理技术专题)[C];2006年
10 贾睿;徐启强;刘艳;;基于神经网络的网壳结构近似分析研究[A];第二十一届全国振动与噪声高技术及应用学术会议论文集[C];2008年
相关重要报纸文章 前1条
1 中国科技大学计算机系 邢方亮;神经网络挑战人类大脑[N];计算机世界;2003年
相关博士学位论文 前10条
1 李晓刚;基于神经网络的码垛机器人视觉位姿测量及伺服控制研究[D];北京林业大学;2015年
2 户保田;基于深度神经网络的文本表示及其应用[D];哈尔滨工业大学;2016年
3 诸勇;正交回归神经网络及其在控制系统中的应用[D];浙江大学;1998年
4 田景文;地下油藏的仿真与预测[D];哈尔滨工程大学;2001年
5 彭宏京;基于稀疏RAM的神经网络及其人脸识别应用研究[D];南京航空航天大学;2002年
6 王吉权;BP神经网络的理论及其在农业机械化中的应用研究[D];沈阳农业大学;2011年
7 郭海湘;石油储层纵向预测软硬计算融合的理论与方法研究[D];中国地质大学;2008年
8 葛利;基于过程神经网络的时序数据挖掘研究[D];哈尔滨工程大学;2012年
9 柴冰华;色貌模型CIECAM02若干问题的研究[D];北京理工大学;2006年
10 唐云岚;集成神经网络和多目标进化算法的卷烟产品参数优化设计方法及应用研究[D];国防科学技术大学;2008年
相关硕士学位论文 前10条
1 陈彦至;神经网络降维算法研究与应用[D];华南理工大学;2015年
2 蔡邦宇;人脸识别中单次ERP时空特征分析及其快速检索的应用[D];浙江大学;2015年
3 郑川;垃圾评论检测算法的研究[D];西南交通大学;2015年
4 汪济民;基于卷积神经网络的人脸检测和性别识别研究[D];南京理工大学;2015年
5 彭玲玲;基于不确定理论与机器学习的行人检测[D];长安大学;2015年
6 杨陈东;BP-Fisher判别分析法[D];长安大学;2015年
7 孟鑫;基于Hadoop云平台下的客流量预测研究[D];长安大学;2015年
8 张勇;深度卷积神经网络在车牌和人脸检测领域的应用研究[D];郑州大学;2015年
9 宋璐璐;财经职业技术学院票务管理系统的设计与实现[D];西安工业大学;2015年
10 陈锐浩;基于神经网络的口令属性分析工具开发[D];上海交通大学;2015年
,本文编号:1849205
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1849205.html