基于数字图像处理的框图识别技术研究

发布时间：2022-07-27 13:10

　　随着计算机技术的发展以及智能手机与电子阅读设备的逐渐普及,电子文档已成为人们主要获取信息的方式之一。大部分印刷体文档是以图片形式进行存储的。得益于光学字符识别技术的发展,人们可以直接从图像中提取需要的数据进行存储、处理和检索,减轻人手工录入负担。然而,文档中还存在着大量框图类图像,现有的OCR技术难以直接提取其表达信息。目前,常规的印刷体框图识别方案主要采用传统方法通过检测框图的轮廓、角点,再依赖人工定义的特征进行特征提取,对框图中的关键区域进行定位。但实际中框图种类繁多,情况可能十分复杂,可能会存在断边、粘连或其他线元干扰等问题,这些情况都是传统方法难以处理的。框图还具有复杂的二维结构,识别中还得考虑图元之间的连接关系。如何正确解析框图的结构关系也是该领域面临的难点。本文通过分析研究框图识别中几个重要问题:框图的关键区域检测,框图内的字符切分与识别,框图的结构识别,将数字图像处理以及深度学习的相关技术应用到框图识别中,最终完成本文的框图识别技术研究。主要阐述了如何对收集到的数据集进行标注以及数据增强,降噪等过程,使用基于YOLOv3深度学习目标检测算法对框图图像的关键区域进行检测,解...

【文章页数】：67 页

【学位级别】：硕士

【文章目录】：
摘要
ABSTRACT
第1章绪论
    1.1 课题背景及研究的目的和意义
    1.2 国内外研究现状
    1.3 本文研究内容
    1.4 论文章节安排
第2章框图识别的相关技术和理论
    2.1 引言
    2.2 框图类型与结构分析
        2.2.1 框图主要类别介绍
        2.2.2 框图的结构分析与描述
    2.3 图像特征提取与目标检测技术
        2.3.1 传统特征提取方法
        2.3.2 深度特征提取方法
        2.3.3 基于深度学习的目标检测技术
    2.4 字符切分与识别方法
    2.5 本章小结
第3章基于YOLOv3的框图图像关键区域检测
    3.1 引言
    3.2 图像降噪处理
    3.3 数据集制作
    3.4 YOLOv3算法
        3.4.1 YOLOv3网络结构
        3.4.2 YOLOv3边框回归
        3.4.3 YOLOv3损失函数
    3.5 YOLOv3多尺度目标检测的优化
        3.5.1 目标先验框聚类分析
        3.5.2 YOLOv3跨尺度检测改进
    3.6 实验结果及分析
        3.6.1 评价指标
        3.6.2 实验环境及主要参数
        3.6.3 实验结果及分析
    3.7 本章小结
第4章框图中字符与结构识别方法研究
    4.1 引言
    4.2 图像二值化处理
    4.3 字符切分
        4.3.1 投影法粗切分
        4.3.2 粘连字符细切分
        4.3.3 字符切分实验结果
    4.4 基于卷积神经网络的字符识别
        4.4.1 LeNet-5网络结构
        4.4.2 添加批标准化层
        4.4.3 字符分类实验结果
    4.5 箭头与图元连接线关系判定
        4.5.1 箭头与图元关系的判定
        4.5.2 连接线提取及与箭头关系判定
    4.6 框图整体结构识别
        4.6.1 连接线细化处理
        4.6.2 基本图元逻辑关系判定
        4.6.3 框图识别结果分析
    4.7 本章小结
结论
参考文献
致谢

本文编号：3665517

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/shengwushengchang/3665517.html

上一篇：基于全局与非全局块匹配的去噪算法
下一篇：基于三维点云数据的空间插值和场景语义分割研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|