当前位置:主页 > 社科论文 > 图书档案论文 >

基于眼动追踪技术的数字阅读系统设计与应用

发布时间:2021-09-24 00:53
  视觉系统是人类获取外部信息的重要途径。采用由眼动姿态进行跟踪的眼动追踪技术来实现人机交互进行阅读是目前数字阅读领域非常高效的一种手段。通过对眼动追踪技术的技术类型、特点及其在数字阅读领域的应用现状进行分析,构建基于单摄像机眼动追踪的数字阅读系统,提取受试者阅读时的眼动特征参数,并对视线落点进行估计。针对受试者头动状态下视线落点估计不准的问题,利用基于特征参数的补偿算法和多变量灰色预测GM(1,N)模型两种方式进行改进,从而降低实验平均像素误差,并对眼动追踪在数字阅读中的应用前景进行展望。 

【文章来源】:图书馆学刊. 2020,42(04)

【文章页数】:9 页

【部分图文】:

基于眼动追踪技术的数字阅读系统设计与应用


VOG非接触式眼动追踪原理

过程图,特征参数,视线,过程


阅读活动描述与阅读心理变化反映在系统架构中就是读者的眼部运动过程。因此人眼特征参数提取就成为实现眼动追踪技术的前提和关键,且提取质量的差异直接关系到结果判别的精度。人眼特征参数的定义依不同的追踪实现技术而确定,单摄像机法通常采用瞳孔角膜向量反射技术(PCCR,the pupil center corneareflection technique),选择近红外光源照射下用户眼睛的角膜和瞳孔上产成反射向量作为人眼参数。而作为这种方法的简化,在自然光条件下可以采用虹膜中心与眼角点之间的向量来作为人眼参数。笔者实验采用自然光条件,视线特征参数提取的过程如图2所示。本方法首先使用Haar-like特征表示人脸(人眼),采用Adaboost算法选择最能代表人脸(人眼)的矩形特征弱分类器,通过加权投票将弱分类器构造成强分类器,训练完成后,将得到的多个强分类器进行串联,形成用于人脸(人眼)检测的层叠分类器的级联结构;然后采用自适应阈值分割法将检测的人眼图像进行虹膜和巩膜分割:分割后的虹膜图像经滤波处理,之后采用cannny算子进行边缘检测,经最小二乘算法椭圆拟合之后计算出虹膜中心坐标(x1,y1),分割后的巩膜图像经滤波处理后进行SUSAN角点检测计算出眼角点中心坐标(x2,y2)。最后将计算出的中心坐标向量化为特征参数(xs,ys)。建立特征参数与视线实际落点的映射模型之后,即可得到阅读者眼睛在屏幕中的注视方向,进而指导后续学习操作。

特征参数,角度,瞳孔,位置


文献[18]根据头动后特征参数与头部位置变化的关系对视线参数进行了改进补偿。当阅读者头部平行移动时,使用者的瞳距是固定值。但是当使用者头部发生转动时,图像瞳距在不同的位置上就会发生变化[19-21]。文献[18]通过补偿头部转动的瞳距值得到标准位置的特征参数值,这样就消除了头部运动带来的视线估计误差量。但是此种方法存在一定不合理之处。整个推导过程都只考虑了矢量的大小,并没有过多地涉及到方向。这样补偿出来的特征参数仅仅反映的是大小的变化,而实际上头部发生运动后特征参数的方向以及角度也会相应发生改变。以下笔者就头部运动后特征参数的角度变化进行分析,以作出更加严谨的补偿形式。特征参数以及瞳孔角度在头部运动过程中的变化如图3所示。其中参数定义为:


本文编号:3406768

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/3406768.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ecdd6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com