图文混编图像的版面分析及识别研究

发布时间:2023-05-05 19:18
  现如今,越来越多的用户通过社交软件向好友分享存在图文混编版面的图像(下文简称“图文混编图像”),而图文混编图像存在庞杂的信息使得用户无法在短时间内获取重要信息。为了快速地帮助用户从图文混编图像中获取尽可能多的有效信息,本文提出了基于图文混编的版面分析算法。该算法不仅能够快速区分图文混编图像的文本标题区、文本正文区以及图像区。而且能够高效地识别文本标题区和图像区的内容,以较低的算法复杂度获取图文混编图像中重要信息。本文主要研究内容如下。(1)提出了融合轮廓投影的连通域版面分割算法。该算法在对图文混编图像进行图像预处理的基础上,首先基于八连通将整个图文混编图像进行单字区域扩充。然后根据轮廓投影后的灰度直方图中波形的规律性和周期性对不同区域进行大致划分。最后通过引入文本行(列)间隔阈值以及图文间隔阈值对各个连通区域进行合并,更加有效地区分文本标题区、文本正文区以及图像区。(2)提出了基于多级划分的单字识别算法。该算法对标题汉字采用36×36点阵归一化处理,首先对标题汉字进行粗划分,根据绝对值距离,从字典库7000个汉字中选出与标题汉字匹配的前m个汉字。然后对标题汉字进行细划分,根据欧氏距离,...

【文章页数】:59 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
引言
第一章 绪论
    1.1 研究背景与意义
    1.2 国内外研究现状综述
        1.2.1 版面分割方法的研究
        1.2.2 文字识别方法的研究
    1.3 本文的组织结构
第二章 相关理论与算法基础
    2.1 版面图像预处理
        2.1.1 图像灰度化
        2.1.2 图像二值化处理
        2.1.3 图像去噪
        2.1.4 版面校正
    2.2 版面分割方法
        2.2.1 非层次化版面分割方法
        2.2.2 层次化的版面分割方法
    2.3 文字识别方法
        2.3.1 基于结构模式的识别方法
        2.3.2 基于统计模式的识别方法
        2.3.3 基于结构模式与统计模式相结合的识别方法
    2.4 本章小结
第三章 基于图文混编的版面分析算法
    3.1 问题的提出
    3.2 融合轮廓投影的连通域版面分割算法
        3.2.1 形成连通域与单字区域扩充
        3.2.2 轮廓投影
        3.2.3 间隔阈值获取
        3.2.4 同质连通域合并
    3.3 基于多级划分的单字识别算法
        3.3.1 特征提取
        3.3.2 模板匹配
    3.4 图像匹配技术
    3.5 实验分析
    3.6 本章小结
第四章 系统设计与实验分析
    4.1 问题的提出
    4.2 系统框架流程
    4.3 算法实验结果分析
    4.4 系统测试
    4.5 本章小结
第五章 总结与展望
    5.1 总结
    5.2 展望
参考文献
致谢
作者简介及读研期间主要科研成果



本文编号:3808251

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3808251.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户88a69***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com