人工智能中面向人类的行为分析
发布时间:2022-01-02 07:16
随着海量训练数据的获得、深度学习技术的进步和相关知识的积累,人工智能在近十年里取得了举世瞩目的进步。在接下来的几年里,人们将迫切地需要以人为中心的人工智能应用。该文希望通过对行为识别相关研究的介绍,让读者了解在开发面向理解人类的人工智能应用上所取得的进步。首先,从行为检测和行为识别两个子任务概述了行为分析,并讨论了该任务中的难点;其次,列举了可用于行为分析的数据模态以及当前被广泛使用的数据库;然后,介绍了当前用于行为识别研究的主要工具,如卷积神经网络和循环神经网络;最后,总结了近十年典型的行为识别方法,包括深度学习出现之前的传统方法和深度学习方法。
【文章来源】:西北大学学报(自然科学版). 2020,50(03)北大核心CSCD
【文章页数】:10 页
【部分图文】:
行为检测和识别举例
在人工智能任务里,构建智能系统与人工标注的数据是密不可分的。近年来我们所使用的主要数据模态分别是视频、光流、深度图像和骨骼坐标数据,其中,光流可以被认为是基于视频数据的衍生。而从数据的采集条件来看,当前数据主要有实验室条件下和in-the-wild条件下采集的两种(带有深度图像的数据库基本都是在实验室条件下采集的)。行为分析中被广泛应用的4种模态如图2所示。图2(a),(b),(d)3种模态实例来自Chalearn Looking At People(LAP)2014数据库[9],图2(c)来自于UCF-101数据库[6]。2.1 图像/视频
卷积神经网络是机器视觉任务中最为流行的深度学习工具之一,已经被广泛应用于物体识别、目标检测和行为分析等任务中。目前常用的卷积神经网络有常被用于语音信号处理的一维卷积模型、用于图片分析的二维卷积模型和用于视频分析的三维卷积模型。以二维神经网络为例,它使用一组滤波器对输入数据以滑窗的方式进行滤波,整个过程正如将输入数据和滤波器权重做卷积操作,故得名卷积神经网络。卷积神经网络的实现特点使得它只能处理规则的网格结构的数据,这一点天然与机器视觉契合。再加上每一个滤波器使用的参数较少,通常在每层可以使用数百个滤波器对图像进行滤波,这使得它已经成为机器视觉任务中主要的空间特征提取手段。图3描述了二维卷积网络的运算过程。3.3 图卷积网络
本文编号:3563734
【文章来源】:西北大学学报(自然科学版). 2020,50(03)北大核心CSCD
【文章页数】:10 页
【部分图文】:
行为检测和识别举例
在人工智能任务里,构建智能系统与人工标注的数据是密不可分的。近年来我们所使用的主要数据模态分别是视频、光流、深度图像和骨骼坐标数据,其中,光流可以被认为是基于视频数据的衍生。而从数据的采集条件来看,当前数据主要有实验室条件下和in-the-wild条件下采集的两种(带有深度图像的数据库基本都是在实验室条件下采集的)。行为分析中被广泛应用的4种模态如图2所示。图2(a),(b),(d)3种模态实例来自Chalearn Looking At People(LAP)2014数据库[9],图2(c)来自于UCF-101数据库[6]。2.1 图像/视频
卷积神经网络是机器视觉任务中最为流行的深度学习工具之一,已经被广泛应用于物体识别、目标检测和行为分析等任务中。目前常用的卷积神经网络有常被用于语音信号处理的一维卷积模型、用于图片分析的二维卷积模型和用于视频分析的三维卷积模型。以二维神经网络为例,它使用一组滤波器对输入数据以滑窗的方式进行滤波,整个过程正如将输入数据和滤波器权重做卷积操作,故得名卷积神经网络。卷积神经网络的实现特点使得它只能处理规则的网格结构的数据,这一点天然与机器视觉契合。再加上每一个滤波器使用的参数较少,通常在每层可以使用数百个滤波器对图像进行滤波,这使得它已经成为机器视觉任务中主要的空间特征提取手段。图3描述了二维卷积网络的运算过程。3.3 图卷积网络
本文编号:3563734
本文链接:https://www.wllwen.com/kejilunwen/rengongzhinen/3563734.html