古籍汉字图像的犹豫模糊检索方法研究
发布时间:2021-05-23 01:34
古籍汉字图像检索是古籍汉字研究人员高效获取相关古籍字形的有效途径。然而,古籍汉字数量庞大、结构复杂、字形多变等特点,导致传统的汉字图像检索技术在面对古籍汉字图像时难以取得令人满意的结果。因此,有必要针对古籍汉字特点,研究有效的古籍汉字图像检索技术,满足古籍汉字研究的实际需要。通过对古籍汉字特点的分析与归纳,引入犹豫模糊集理论,对古籍汉字图像检索关键技术展开研究,主要工作分为以下两部分:(1)设计了基于犹豫模糊集的古籍汉字图像切分算法研究、设计古籍版面图像去噪、切分算法,得到古籍汉字预切分结果。在此基础上,对预切分结果中存在的过切分和欠切分错误进行校正,利用犹豫模糊集在处理多属性决策问题方面的优势,通过对预切分汉字的特征分析,建立犹豫模糊集,实现对存在过切分错误区域的鉴别及合并处理,并对存在粘连和重叠问题的汉字区域采用分段像素跳跃数突变分析方法进行分割,得到古籍汉字单字图像。采用《四库全书》中的文渊阁、文津阁、文溯阁、文澜阁共92页样张图像(28886个单字)进行实验,提出的方法对过切分汉字的合并准确率为85.7%,汉字的切分准确率为92.3%。(2)设计并实现了基于犹豫模糊加权距离测度...
【文章来源】:河北大学河北省
【文章页数】:81 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究背景
1.2 国内外研究现状
1.2.1 图像检索技术
1.2.2 汉字图像检索与识别技术
1.2.3 文档图像分析与文字切分技术
1.2.4 犹豫模糊集
1.3 论文的主要工作
1.4 论文的结构安排
第二章 古籍文献图像分析与古籍汉字切分
2.1 古籍文献图像预处理
2.2 古籍汉字图像预切分
2.3 古籍汉字图像过切分处理
2.3.1 犹豫模糊集定义及测度
2.3.2 古籍汉字图像过切分鉴别
2.3.3 过切分古籍汉字合并的鉴别属性
2.3.4 基于犹豫模糊集的古籍汉字图像过切分合并
2.4 古籍汉字图像欠切分处理
2.5 本章小结
第三章 古籍汉字图像检索
3.1 古籍汉字图像检索系统结构
3.2 古籍汉字图像细化处理
3.3 古籍汉字图像检索特征提取及分析
3.3.1 古籍汉字图像的笔画特征
3.3.2 古籍汉字图像的角点特征
3.3.3 古籍汉字图像的字形结构特征
3.3.4 古籍汉字图像的统计特征
3.4 古籍汉字图像索引构建
3.5 古籍汉字图像的隶属度函数定义
3.6 基于犹豫模糊加权距离测度的古籍汉字图像相似度匹配
3.7 本章小结
第四章 实验过程及结果分析
4.1 实验环境及数据集
4.2 实验参数设置
4.3 评价指标建立
4.4 实验结果及分析
4.4.1 古籍汉字图像切分
4.4.2 古籍汉字图像检索
4.5 本章小结
第五章 总结与展望
5.1 工作总结
5.2 后续工作展望
参考文献
致谢
攻读学位期间取得的科研成果
【参考文献】:
期刊论文
[1]基于卷积神经网络的图像分割算法[J]. 郑文超. 电子技术与软件工程. 2019(21)
[2]面向非规则排列汉字文本的字符分割方法[J]. 杨谢柳,牛玺辉,梁文峰. 计算机辅助设计与图形学学报. 2019(09)
[3]基于改进得分函数的属性变权重区间直觉模糊集的群决策方法[J]. 要瑞璞. 统计与决策. 2019(11)
[4]一种基于加权颜色形状特征和LBP-GLCM纹理特征提取的服装图像检索方法[J]. 缪智文,何丽嘉,刘洞波. 纺织报告. 2019(04)
[5]结合余弦相关性的卷积网络识别汉字的方法[J]. 刘虹,王烈. 计算机工程与应用. 2020(08)
[6]卷积神经网络在古籍汉字识别中的应用实践[J]. 郭利敏,葛亮,刘悦如. 图书馆论坛. 2019(10)
[7]基于区间直觉模糊数的得分函数与精确函数及其应用[J]. 龚日朝,马霖源. 系统工程理论与实践. 2019(02)
[8]一种新犹豫模糊符号距离及其应用[J]. 刘小弟,朱建军,张世涛,王治莹. 系统工程理论与实践. 2019(02)
[9]基于改进inception的脱机手写汉字识别[J]. 陈站,邱卫根,张立臣. 计算机应用研究. 2020(04)
[10]多特征融合的复杂环境海洋涡旋识别[J]. 黄冬梅,刘佳佳,苏诚,杜艳玲. 中国图象图形学报. 2019(01)
硕士论文
[1]基于犹豫模糊特征的古籍汉字图像检索[D]. 柴彦立.河北大学 2019
[2]古籍手写文字分割算法的研究与应用[D]. 苏敏.兰州交通大学 2018
[3]古文献文字图像分割与差异性比对算法研究[D]. 吴相锦.兰州交通大学 2016
[4]基于对称区域的古籍汉字图像检索[D]. 贾雪莎.河北大学 2014
本文编号:3202031
【文章来源】:河北大学河北省
【文章页数】:81 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究背景
1.2 国内外研究现状
1.2.1 图像检索技术
1.2.2 汉字图像检索与识别技术
1.2.3 文档图像分析与文字切分技术
1.2.4 犹豫模糊集
1.3 论文的主要工作
1.4 论文的结构安排
第二章 古籍文献图像分析与古籍汉字切分
2.1 古籍文献图像预处理
2.2 古籍汉字图像预切分
2.3 古籍汉字图像过切分处理
2.3.1 犹豫模糊集定义及测度
2.3.2 古籍汉字图像过切分鉴别
2.3.3 过切分古籍汉字合并的鉴别属性
2.3.4 基于犹豫模糊集的古籍汉字图像过切分合并
2.4 古籍汉字图像欠切分处理
2.5 本章小结
第三章 古籍汉字图像检索
3.1 古籍汉字图像检索系统结构
3.2 古籍汉字图像细化处理
3.3 古籍汉字图像检索特征提取及分析
3.3.1 古籍汉字图像的笔画特征
3.3.2 古籍汉字图像的角点特征
3.3.3 古籍汉字图像的字形结构特征
3.3.4 古籍汉字图像的统计特征
3.4 古籍汉字图像索引构建
3.5 古籍汉字图像的隶属度函数定义
3.6 基于犹豫模糊加权距离测度的古籍汉字图像相似度匹配
3.7 本章小结
第四章 实验过程及结果分析
4.1 实验环境及数据集
4.2 实验参数设置
4.3 评价指标建立
4.4 实验结果及分析
4.4.1 古籍汉字图像切分
4.4.2 古籍汉字图像检索
4.5 本章小结
第五章 总结与展望
5.1 工作总结
5.2 后续工作展望
参考文献
致谢
攻读学位期间取得的科研成果
【参考文献】:
期刊论文
[1]基于卷积神经网络的图像分割算法[J]. 郑文超. 电子技术与软件工程. 2019(21)
[2]面向非规则排列汉字文本的字符分割方法[J]. 杨谢柳,牛玺辉,梁文峰. 计算机辅助设计与图形学学报. 2019(09)
[3]基于改进得分函数的属性变权重区间直觉模糊集的群决策方法[J]. 要瑞璞. 统计与决策. 2019(11)
[4]一种基于加权颜色形状特征和LBP-GLCM纹理特征提取的服装图像检索方法[J]. 缪智文,何丽嘉,刘洞波. 纺织报告. 2019(04)
[5]结合余弦相关性的卷积网络识别汉字的方法[J]. 刘虹,王烈. 计算机工程与应用. 2020(08)
[6]卷积神经网络在古籍汉字识别中的应用实践[J]. 郭利敏,葛亮,刘悦如. 图书馆论坛. 2019(10)
[7]基于区间直觉模糊数的得分函数与精确函数及其应用[J]. 龚日朝,马霖源. 系统工程理论与实践. 2019(02)
[8]一种新犹豫模糊符号距离及其应用[J]. 刘小弟,朱建军,张世涛,王治莹. 系统工程理论与实践. 2019(02)
[9]基于改进inception的脱机手写汉字识别[J]. 陈站,邱卫根,张立臣. 计算机应用研究. 2020(04)
[10]多特征融合的复杂环境海洋涡旋识别[J]. 黄冬梅,刘佳佳,苏诚,杜艳玲. 中国图象图形学报. 2019(01)
硕士论文
[1]基于犹豫模糊特征的古籍汉字图像检索[D]. 柴彦立.河北大学 2019
[2]古籍手写文字分割算法的研究与应用[D]. 苏敏.兰州交通大学 2018
[3]古文献文字图像分割与差异性比对算法研究[D]. 吴相锦.兰州交通大学 2016
[4]基于对称区域的古籍汉字图像检索[D]. 贾雪莎.河北大学 2014
本文编号:3202031
本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/3202031.html