嵌入式盲人阅读器系统设计与开发
发布时间:2017-07-01 14:14
本文关键词:嵌入式盲人阅读器系统设计与开发,,由笔耕文化传播整理发布。
【摘要】:人们日常生活中接触到的多数信息都以图像的形式进行传递,盲人以及视力障碍人士由于视力缺陷在没有正常人帮助下根本无法获取这些信息,这很大程度上限制了盲人认知世界的机会。盲人阅读器是一款融合了光学字符识别(OCR)和语音合成(TTS)技术、实现图像文字到语音转换的设备,能帮助盲人自由获取纸质以及电子版文字信息。本文所实现的盲人阅读器系统使用QT进行界面编写,可分为以下模块:(1) 视频图像采集与预处理模块。该模块主要完成摄像头视频待识别文档的采集以及包括灰度化、二值化、去噪、版面分析、倾斜校正、字符切分等的图像预处理。本文通过比较分析,选取了合适的算法,取得了良好的实验效果。该模块是整个盲人阅读器系统的基础,其性能稳定与否直接关系到系统识别率的高低。(2) 文本识别模块。该模块由字符预处理、特征提取和文本识别组成,是整个系统的核心。本文介绍了细化和归一化字符预处理算法,并详细介绍了汉字识别中常用的几种汉字特征提取过程。考虑到汉字数量巨大,属于超大类别模式识别,本文利用汉字各种特征的互补性,采取了多级粗分类和细分类相结合的多特征多分类器汉字识别方法,粗分类缩小了待匹配字符范围,有效减少了计算量,细分类利用多种特征进行联合判别,汉字识别准确率得到很大提升。(3) 语音播报模块。针对软件使用环境的不同,本文实现了基于Microsoft SpeechSDK、科大讯飞MSP、自制语音库三种语音播报方法,都取得了较好效果,其中自制语音库语音播报适用于各种平台,但语音不够流畅,且占据较大存储空间。此外,为增加软件的交互性,Windows下软件中添加了语音识别模块,方便盲人通过语音的方式使用软件。结果表明,软件系统智能友好地完成了盲人阅读基本功能,对印刷体中文文档识别准确率达到99.67%,达到了软件设计要求。本文中实现了盲人阅读器系统的嵌入式开发,选用合众达DVS6446为硬件平台,QT/Embedded为嵌入式图形界面开发_工具(主要为方便调试引入)。本文完成了嵌入式Linux开发环境的搭建过程,包括搭建交叉编译环境、内核的配置与移植、QT/Embedded移植等。通过交叉编译嵌入式盲人阅读器应用程序,得到可执行文件,利用挂载网络文件系统NFS方式实现了程序在目标平台的运行,经过反复调试,该系统能够完成盲人阅读功能日运行良好。
【关键词】:盲人阅读 汉字识别 DVS6446 QT/Embedded 语音合成
【学位授予单位】:大连理工大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.41;TN873
【目录】:
- 摘要4-5
- Abstract5-9
- 1 绪论9-13
- 1.1 课题研究背景及意义9
- 1.2 国内外研究现状9-11
- 1.2.1 文字识别(OCR)技术发展历程10-11
- 1.2.2 语音合成(TTS)技术发展历程11
- 1.3 面临技术挑战11-12
- 1.4 论文章节安排12-13
- 2 盲人阅读器系统相关理论知识介绍13-34
- 2.1 文本图像预处理13-23
- 2.1.1 灰度化、二值化与去噪14-17
- 2.1.2 倾斜校正17-20
- 2.1.3 版面分析20-22
- 2.1.4 文本定位22-23
- 2.2 字符特征提取与识别23-31
- 2.2.1 字符预处理24-25
- 2.2.2 汉字特征提取25-28
- 2.2.3 特征匹配与识别28-31
- 2.3 语音识别与合成31-34
- 2.3.1 语音识别基本原理31-32
- 2.3.2 语音合成基本原理32-34
- 3 嵌入式盲人阅读器系统平台概述与开发环境搭建34-47
- 3.1 系统硬件平台概述34-35
- 3.2 系统软件平台概述35-38
- 3.2.1 嵌入式操作系统的选择35-36
- 3.2.2 嵌入式GUI的选择36-38
- 3.3 盲人阅读器嵌入式Linux开发环境搭建38-40
- 3.3.1 交叉编译环境搭建与配置38-39
- 3.3.2 配置NFS服务39
- 3.3.3 配置TFTP服务39-40
- 3.4 内核编译与移植40-43
- 3.5 嵌入式GUI开发环境搭建43-47
- 3.5.1 QT编程概述43-44
- 3.5.2 Host Linux下QT4开发环境搭建44-47
- 4 盲人阅读器系统设计与结果分析47-61
- 4.1 Windows平台下盲人阅读器软件设计与实现49-55
- 4.2 基于DVS6446的嵌入式盲人阅读器系统实现55-58
- 4.2.1 摄像头图片获取模块设计55-56
- 4.2.2 阅读模块设计56-57
- 4.2.3 嵌入式程序运行、移植与测试57-58
- 4.3 实验与结果分析58-61
- 结论61-62
- 参考文献62-65
- 致谢65-66
【参考文献】
中国硕士学位论文全文数据库 前1条
1 霍超;嵌入式OCR系统的研究[D];北方工业大学;2010年
本文关键词:嵌入式盲人阅读器系统设计与开发,由笔耕文化传播整理发布。
本文编号:506236
本文链接:https://www.wllwen.com/kejilunwen/wltx/506236.html