基于破损字符修复识别的文档拼接工作研究

发布时间:2021-01-08 04:07
  随着深度学习时代的来临,计算机视觉在许多语义理解任务上都取得了很好的成绩,包括分类、检测、分割。将破碎的文档数据进行拼接,并恢复出原状是一个十分困难的问题。它涉及到计算机视觉和人工智能算法当中的匹配、识别、大规模状态空间当中的搜索等问题。研究文档拼接问题过程中涉及的上述这些技术除了其本身对计算机视觉和人工智能算法相关问题有重要的意义之外,解决文档问题在考古、刑侦领域也有广泛的应用。本文注意到了文档碎片条大多包含字符这一基本元素(完好字符或者破损字符),可以提供语义信息来实现文档拼接工作。尽管光学字符识别技术已经广泛用于完好的字符,但在破损字符的识别上仍有难度。因此,本文试图解决条形文档重建工作,旨在通过修复识别碎片条边缘上的破损字符,来完成文档拼接重建工作。在这个问题当中,我们将文档拼接工作简化为一类特殊的碎片,即假定为竖直切割的条形碎片条。另一个简化为仅考虑英文字符和数字组成的文档。本文主要研究了三个方面的内容:(1)基于竖直切割的条形碎片条的文本检测。(2)基于破损字符的修复识别工作。(3)基于竖直切割的条形碎片条的文档匹配重建工作。因此,本文的主要贡献如下:(1)设计了二阶破损字... 

【文章来源】:厦门大学福建省 211工程院校 985工程院校 教育部直属院校

【文章页数】:95 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第一章 绪论
    1.1 研究背景
    1.2 研究问题
        1.2.1 文档拼接技术
        1.2.2 字符识别技术
        1.2.3 图像修复技术
    1.3 本文的主要研究内容
    1.4 本文的结构安排
第二章 基于条形文档的文本检测
    2.1 相关背景
    2.2 行检测算法
    2.3 字符检测算法
        2.3.1 拼接字符分割
        2.3.2 边缘字符分割
    2.4 实验效果
        2.4.1 行检测效果
        2.4.2 字符检测效果
    2.5 本章小结
第三章 破损字符修复识别器
    3.1 相关背景
        3.1.1 现有图像修复技术的不足
        3.1.2 条件生成对抗网络
        3.1.3 基于分类的生成对抗网络
    3.2 破损字符修复识别器
        3.2.1 框架设计
        3.2.2 整体识别策略
    3.3 破损字符字形预测器
        3.3.1 整体架构
        3.3.2 损失函数
        3.3.3 模型设计
    3.4 破损字符字体修复识别器
        3.4.1 整体架构
        3.4.2 损失函数
        3.4.3 模型设计
    3.5 实验设置
        3.5.1 数据集
        3.5.2 训练策略
        3.5.3 掩模设计
        3.5.4 评估方式
    3.6 实验效果
        3.6.1 破损字符修复识别器实验
        3.6.2 破损字符字形预测器实验
        3.6.3 破损字符字体修复识别器实验
    3.7 本章小结
第四章 条形文档拼接匹配算法
    4.1 相关背景
    4.2 局部匹配问题
    4.3 全局重组搜索问题
        4.3.1 排除无关序列方法
        4.3.2 择优匹配方法
    4.4 实验设置
        4.4.1 数据集
        4.4.2 评估方式
    4.5 实验效果
        4.5.1 文档拼接实验
        4.5.2 破损字符修复识别器修复实验
        4.5.3 局部匹配实验
        4.5.4 全局重组搜索实验
    4.6 本章小结
第五章 总结与展望
    5.1 总结
    5.2 展望
参考文献
致谢



本文编号:2963879

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/2963879.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d7a74***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com