基于学习的视线估计及应用
发布时间:2023-06-02 19:34
典型的人机交互通过对人机界面的直接触控实现用户与机器间的信息传递。随着多媒体技术和人工智能的不断发展,非接触式人机交互给用户带来全新的感官和心理体验。作为非接触式人机交互的重要分支,视线交互以其重要的科研和应用价值逐渐获得人们的重视。所谓视线交互,即通过视线估计实现通过眼球运动进行触控操作的技术,因此,如何简便且准确地实现视线方向的估计至关重要。传统的视线估计方法通过获取瞳孔和角膜中心的位置来确定视线方向,这种方法通常需要高分辨率的相机、复杂的外接设备如红外光源、各种传感设备等,价格昂贵且使用不便。深度学习通过大量的图像训练神经网络,在人工智能时代得到了巨大的发展并逐步成为当前视线估计领域的研究热点。然而,目前常见的基于学习的视线估计方法大多采用回归的方法估计注视点的具体位置。由于跳跃式眼动的存在,精度低误差大,估计人眼注视的具体位置相当困难,无法满足触控操作的要求。此外,不同于传统的基于模型的估计方法,基于学习的视线估计需要海量的数据作为驱动,因此,建立合适的数据库对于相关研究至关重要。针对以上问题,考虑到触控操作的基本任务特点,本文提出的基于学习的视线估计方法将分类作为主要的研究方...
【文章页数】:61 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景及意义
1.2 视线估计技术国内外研究现状
1.3 研究课题的提出
1.4 论文主要研究内容及结构
1.4.1 研究内容
1.4.2 论文结构
第二章 基于学习的视线估计方法介绍
2.1 引言
2.2 常见人眼特征介绍
2.3 常见回归模型介绍
2.4 卷积神经网络
2.4.1 概述
2.4.2 卷积神经网络主要结构介绍
2.5 视线估计系统架构
2.6 本章小结
第三章 人眼数据库建立
3.1 引言
3.2 人眼数据库比较
3.3 数据库建立
3.3.1 图像采集
3.3.2 图像处理
3.3.3 数据库结构
3.4 本章小结
第四章 基于单眼图像的视线估计
4.1 引言
4.2 实验网络设计
4.3 网络各层输出
4.4 网络性能分析
4.4.1 网络平均分类性能分析
4.4.2 网络各类分类性能分析
4.5 本章小结
第五章 基于双眼图像的视线估计
5.1 引言
5.2 训练过程基本设计
5.3 网络性能分析
5.3.1 网络平均分类性能
5.3.2 网络各类分类性能分析
5.3.3 与MPIIGaze数据库的比较
5.3.4 跨个体性能分析
5.3.5 不同方法比较
5.4 本章小结
第六章 总结与展望
6.1 论文主要工作总结
6.2 未来工作展望
参考文献
致谢
攻读硕士学位期间发表的学术论文
学位论文评阅及答辩情况表
本文编号:3827903
【文章页数】:61 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景及意义
1.2 视线估计技术国内外研究现状
1.3 研究课题的提出
1.4 论文主要研究内容及结构
1.4.1 研究内容
1.4.2 论文结构
第二章 基于学习的视线估计方法介绍
2.1 引言
2.2 常见人眼特征介绍
2.3 常见回归模型介绍
2.4 卷积神经网络
2.4.1 概述
2.4.2 卷积神经网络主要结构介绍
2.5 视线估计系统架构
2.6 本章小结
第三章 人眼数据库建立
3.1 引言
3.2 人眼数据库比较
3.3 数据库建立
3.3.1 图像采集
3.3.2 图像处理
3.3.3 数据库结构
3.4 本章小结
第四章 基于单眼图像的视线估计
4.1 引言
4.2 实验网络设计
4.3 网络各层输出
4.4 网络性能分析
4.4.1 网络平均分类性能分析
4.4.2 网络各类分类性能分析
4.5 本章小结
第五章 基于双眼图像的视线估计
5.1 引言
5.2 训练过程基本设计
5.3 网络性能分析
5.3.1 网络平均分类性能
5.3.2 网络各类分类性能分析
5.3.3 与MPIIGaze数据库的比较
5.3.4 跨个体性能分析
5.3.5 不同方法比较
5.4 本章小结
第六章 总结与展望
6.1 论文主要工作总结
6.2 未来工作展望
参考文献
致谢
攻读硕士学位期间发表的学术论文
学位论文评阅及答辩情况表
本文编号:3827903
本文链接:https://www.wllwen.com/yixuelunwen/swyx/3827903.html