试卷文本检测技术研究
发布时间:2023-03-14 19:00
随着人们对高质量教育需求的增长以及人工智能技术的发展,个性化教育成为一个非常具有前景的方向,线上与线下教育的有机结合是个性化教育中非常重要的一个环节。线下教育过程中通常会产生大量的纸质试卷,手机拍摄试卷图像是非常便捷的一种方式,因此将试卷图像中有效信息抽取出来并将其转换为文本是个性化教育过程中非常重要的一个场景。文本检测是文本识别的基础,其目标是将图像中文本区域标注出来,传统图像处理和深度学习在文本检测领域均取得了一些成果,但也存在不同的问题。目前文本检测技术大致分为两个研究方向:自底向上方向和自顶向下方向。自底向上的方法一般采用传统图像处理方法,通过人工设计特征检测字符和文本框,由于缺少语义信息容易将部分背景检测为文本。自顶向下的方法通常使用深度学习方法训练端到端的检测模型,在训练过程中需要大量的标注数据,但因为试卷中文本框密集,对试卷进行大量文本标注在试卷文本检测场景中是昂贵且不可行的。虽然目前已经有很多文本检测算法,但是针对试卷文本检测场景的并不多。试卷文本检测可以视为文本检测的一个特殊场景,是一项具有挑战性的任务,其难点在于需要从不同大小、图像质量参差不齐、文字图表混合、手写字...
【文章页数】:67 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第1章 绪论
1.1 研究背景及意义
1.2 研究现状
1.3 研究内容
1.4 本文组织结构
1.5 本章小结
第2章 相关工作
2.1 深度学习方法概述
2.1.1 卷积神经网络
2.1.2 感兴趣区域池化
2.2 强化学习方法概述
2.2.1 马尔可夫决策
2.2.2 Q-learning
2.3 文本检测概述
2.3.1 自底向上
2.3.2 自顶向下
2.4 本章小结
第3章 基于判别器的试卷文本检测算法
3.1 图像预处理
3.1.1 外接矩形
3.1.2 候选矩形
3.2 字符判别器
3.2.1 特征提取
3.2.2 模型结构
3.2.3 数据自纠正
3.3 判别器指导
3.4 文本框构造
3.5 本章小结
第4章 基于DQN的试卷文本框微调算法
4.1 扩充预处理
4.2 微调动作规则
4.3 微调过程描述
4.4 双分支融合网络结构
4.5 本章小结
第5章 实验结果与分析
5.1 实验环境
5.2 数据集
5.2.1 EPDB数据集
5.2.2 CDB数据集
5.3 评价方法与指标
5.4 对比实验
5.4.1 CDM
5.4.2 TDCD
5.4.3 TDMA
5.5 本章小结
第6章 总结与展望
6.1 总结
6.2 展望
致谢
参考文献
攻读学位期间发表的学术论文及参加科研情况
本文编号:3762564
【文章页数】:67 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第1章 绪论
1.1 研究背景及意义
1.2 研究现状
1.3 研究内容
1.4 本文组织结构
1.5 本章小结
第2章 相关工作
2.1 深度学习方法概述
2.1.1 卷积神经网络
2.1.2 感兴趣区域池化
2.2 强化学习方法概述
2.2.1 马尔可夫决策
2.2.2 Q-learning
2.3 文本检测概述
2.3.1 自底向上
2.3.2 自顶向下
2.4 本章小结
第3章 基于判别器的试卷文本检测算法
3.1 图像预处理
3.1.1 外接矩形
3.1.2 候选矩形
3.2 字符判别器
3.2.1 特征提取
3.2.2 模型结构
3.2.3 数据自纠正
3.3 判别器指导
3.4 文本框构造
3.5 本章小结
第4章 基于DQN的试卷文本框微调算法
4.1 扩充预处理
4.2 微调动作规则
4.3 微调过程描述
4.4 双分支融合网络结构
4.5 本章小结
第5章 实验结果与分析
5.1 实验环境
5.2 数据集
5.2.1 EPDB数据集
5.2.2 CDB数据集
5.3 评价方法与指标
5.4 对比实验
5.4.1 CDM
5.4.2 TDCD
5.4.3 TDMA
5.5 本章小结
第6章 总结与展望
6.1 总结
6.2 展望
致谢
参考文献
攻读学位期间发表的学术论文及参加科研情况
本文编号:3762564
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3762564.html