视觉场景信息的层级表征

发布时间：2020-11-01 05:57

　　人类智能具有快速学习和灵活迁移的特点,在应对复杂多变的外部环境时较人工智能系统表现出不可比拟的优势。智能系统运算加工的效率取决于其内部的表征(Marr,1982;Neisser,1967),良好的表征形式正是人类智能拥有该优势的重要原因。现有的视知觉研究大多围绕着“特征”和“客体”等心理表征形式展开(TreismanGelade,1980;Kahneman,TreismanGibbs,1992)。然而,生活中的现实场景远比“特征”和“客体”复杂得多。视觉系统能够识别场景中的多个对象,理解其中的复杂关系,并提取出视觉场景的语义(ZhuMumford,2007)。人类的认知系统如何高效地表征复杂多变的视觉场景是当前认知心理学领域的重要理论问题。由于带有视觉语法的层级结构可通过递归的方式构建出多层次关系,以表示整个场景,且不同的场景信息都可以表达为这一形式,笔者据此认为,场景信息是以视觉语法层级树的形式加以表征的。本论文拟围绕上述假设开展系统研究。本研究针对场景区域分割信息,采用心理物理法与计算建模技术,以层级结构的节点深度效应为指标就场景信息的层级结构表征进行了系统考察。整个研究由两部分组成。研究一主要探讨视觉系统能否对场景中具有复杂空间关系的多个区域构建层级结构表征。该部分研究中,以分割法则为场景区域关系语法规则的层级树,通过层层迭代的方式生成场景分割图,比较层级树中不同深度节点变化条件下的记忆绩效,以检验层级表征存在与否。研究二选取水平和垂直切割规则下的场景区域分割信息,尝试性地就其层级表征的计算过程进行认知建模,并通过比较人和模型在场景分割相关认知任务中的绩效对该模型加以检验。本研究获得以下主要结论:(1)在场景区域分割信息的加工中,层级结构中不同深度节点的属性变化产生了不同的行为绩效,且该绩效差异不能由颜色变化面积等方面的差异所解释。上述结果表明场景信息加工中存在层级表征。(2)在不同结构类型和不同切割规则的场景区域信息加工中,不同节点深度条件的绩效差异均存在。上述结果表明场景信息的层级表征具有普遍性,不仅具有跨层级结构类型的一致性,且具有跨语法规则的一致性。(3)构建了基于贝叶斯推断方法的认知模型。该模型针对场景分割任务输出的结果与人的绩效一致。可以认为,该计算模型良好地仿真了层级表征的构建及其在场景信息相关认知任务中的计算过程。本研究首次针对视觉场景,为发展描述实际执行过程的心理学理论提供了有益的尝试,也为将心理学研究应用于人工智能算法设计提供了示范性的案例。
【学位单位】：浙江大学
【学位级别】：博士
【学位年份】：2018
【中图分类】：B842
【部分图文】：

示意图,表征形式,层级结构,示意图

层级树的核心在于通过迭代、递归，将“有限的组件”在“有限的规则”层层组装，用以表达无限的知识。这使得它同时满涵盖广、空间小、搜索快对智能知识表征的要求。其中有限组件与层层迭代缺一不可。假如只用有限件来表征复杂的知识，则会在“涵盖范围”与“空间尺度”上陷入两难。如件的数目过少，则假设空间范围虽小，但其涵盖范围同时过窄，使得认知模于“天真”，无法捕获外部世界的复杂性。而如果组件数目过多，遍历各种情则表征涵盖范围虽广，但尺度太大，会陷入前述“无序图书馆困境”。而层通过对有限组块的在纵深上的重复利用化解了上述两难。完全不同的复杂情可以“共享”完全相同的组件，不同的仅仅是对组件进行组装的树状结构。对新的、更复杂的情景时，层级树并不需要添加新的组件，而只需要对旧组新的树状结构下进行重组。同时，由于表征被限定在了树状结构下，模型对假设的搜索也变得高效。对正确表征的搜索过程，即是对一个树状结构的生

转换生成语法,解析树,语法

转换－生成语法理论中的层级结构表征，在诸多层面的语言认知研究如句法Ｃｈｏｍｓｋｙ．?１９６４）、语义识别（Ｓｍｉｔｈ，?Ｓｈｏｂｅｎ，＆Ｒｉｐｓ，?１９７４）和语音识别（ＮｏｒｒｉｓｃＱｕｅｅｎ，?２００８）等领域中均获得了证据。最近的研究则进一步揭示了与语相关的“概念学习”领域的等级表征（Ｈａｍｌｉｎ?ｅｔａｌ．，?２０１３；?Ｊｏｈｎｓｏｎ＆Ｋｅｉｌ，?２０１４）的层级结构表征也得到了认知神经科学证据的支持。在最近一项受到乔姆度评价和多次引用的工作中，有研究者（Ｄｉｎｇ，?Ｚｈａｎｇ，?Ｔｉａｎ，?＆?Ｐｏｅｐｐｅｌ，?２０１６）利用脑磁图（ＭＥＧ）和颉内脑电（ＥＣｏＧ）测量，发现对于听觉通道输入刺激，不同周期的神经震荡可以并行跟踪单词、短语和句子等不同层次语的加工进程。??转换－生成语法理论不仅提出了理解语言的表征，并提供了相应的对该表征的??法则?“情景－独立语法”（ｃｏｎｔｅｘｔ－ｆｒｅｅ?ｇｒａｍｍａｒ，?ＣＦＧ）。其中，“语法”??组块分解为小组块的规则的集合。“情景独立”指语法规则本身不受其出

归纳学习,建筑风格,语法

的稳定性和内容的灵活性。多次调用此程序即可生成大量的相似有不同的图形。??例如，程序模型可通过有限的示例图形，学习到古代东亚的建筑风格，并以此为??基础生成了大量类似的建筑（Ｔａｌｔｏｎ?ｅｔ?ａｌ．，２０１２，图１．３）。ＰＣＦＧ也被应用到基因组??功能识别（Ｋｎｕｄｓｅｎ?＆?Ｈｅｉｎ，２００３），网页设计（Ｔａｌｔｏｎ?ｅｔ?ａｌ．，?２０１２）等领域。??ｉ?—?一…ｙ?＃；ｖ；：?Ｃ?＿??－Ｉ?：秦，１．、Ａ?．农多占．．之?４?—??％?心?，－士?－?’?４?一七＇?二、?．??图１．３通过语法归纳学习建筑风格（Ｔａｌｔｏｎ?ｅｔａｌ．．?２０１２）??１．４视觉表征??１．４．１视觉的语义输出??本文重点关注表征在“视觉”这一认知科学的核心领域中的作用。人类视觉??的最终输出可涵盖大量丰富的内容和意义，包括视觉场景的结构，物体在场景中??的作用，物体与物体间的关系，人与物的关系，人与人的关系，以及人与环境的??关系等。??视觉的语义属性对社会生活具有重大影响，也是摄影能成为一个独立的艺术??门类的基础。大量出色的摄影图片成为经典，并非仅仅是构图精美、内容新颖，??而是以它们特有的语言
【相似文献】

相关期刊论文前10条

1 夏杨雄;顾沛峰;徐巧勇;沈涛;;一种数字电视关联场景信息的传输方式及其系统[J];广播与电视技术;2012年08期

2 陈云彪;兰天;;基于场景信息注意模型的目标检测技术研究[J];信息与电脑(理论版);2017年22期

3 孙雨生;张智君;吴彬星;;上下文预期在快速场景识别中的作用[J];心理学报;2017年05期

4 徐周;王慧灵;;原生广告:一种新的品牌传播手段[J];青年记者;2018年14期

5 王马龙;胡晓勤;王琳;陈刚;;Android智能手机用户场景信息防泄漏系统的研究与实现[J];信息网络安全;2013年02期

6 田俊峰;郭玉慧;;基于检查点场景信息的软件行为可信预测模型[J];通信学报;2018年09期

7 韩峰;宁川;;地形场景信息多通道优化绘制仿真研究[J];计算机仿真;2017年01期

8 汤诗旷;;《百苗图》中的清代苗寨生活场景概览与研究[J];建筑遗产;2017年04期

9 匡仁炳;宋和平;;基于无线电相关链路分析的无携带式定位方法[J];科技广场;2015年02期

10 吴洁;刘彦华;;VR 下一个风口?[J];小康;2016年20期

相关博士学位论文前3条

1 唐宁;视觉场景信息的层级表征[D];浙江大学;2018年

2 朱琳;场景信息估计与遮挡条件下目标跟踪问题研究[D];清华大学;2009年

3 王东;腹侧被盖区多巴胺神经元编码激励与动机信号[D];华东师范大学;2011年

相关硕士学位论文前10条

1 程昊;复杂场景的主旨提取机制[D];浙江大学;2011年

2 陈阵;基于场景信息的手机报警装置设计[D];电子科技大学;2010年

3 尚红霞;陀螺仪在基于Hash结构的三维重建中的应用[D];天津大学;2016年

4 蔡骥然;基于智能变电站网络全场景信息的二次状态在线监测技术研究[D];华北电力大学(北京);2016年

5 肖志勇;基于可变形部件模型融合上下文的物体类检测[D];吉林大学;2014年

6 刘庆伟;基于VRML的虚拟校园研究与实现[D];西安建筑科技大学;2007年

7 张静;基于故事板的大规模群体行为动画生成方法的研究[D];天津大学;2014年

8 宋笑林;分布式虚拟现实系统中的场景编辑与运动仿真[D];河南大学;2013年

9 董润芝;文本中场景识别的研究与分析[D];哈尔滨工业大学;2010年

10 陈云彪;基于视觉注意机制的感兴趣目标检测研究[D];厦门大学;2014年

本文编号：2865118

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/shekelunwen/xinlixingwei/2865118.html

上一篇：新疆城市维吾尔族老年人居住模式、健康状况与幸福感的关系研究
下一篇：自我损耗对自我效能感的影响：意志力信念的调节作用

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|