藏文历史文献中粘连字丁串的切分与识别
【图文】:
北京工业大学工程硕士专业学位论文上进行了初步的实验;在 3.5 节,对本章进行了总结。3.2 数据集的收集藏文文字是一种拼写型文字,包含 30 个辅音字母和 4 个元音,如图 3-1(a)和(b)所示。从字形上来说,存在很大的相似性,再加上时间因素造成的字丁粘连,对藏文历史文献进行数字化任务有很大困难。
- 13 -图 3-3 藏文历史文献中的一页Figure 3-3 A page in the Tibetan historical document藏文粘连字丁串的收集工作包括预处理、版面分析、行切分、连通区域分析、后处理等步骤。在预处理阶段,本文主要针对粘连字丁串进行了二值化和降噪操作,目的是为了使原始数据尽可能的不失真。在进行版面分析时,本文使用了张西群[47]等人的方法对扫描的图像进行了版面分析,该方法是通过连通区域分析和角点检测而进行的。首先对扫面后图像进行角点检测,文中利用伽马变换对图像进行了图像增强,,接着使用大津算法对图像进行二值化处理,最后使用 Harris检点检测算法检测角点;然后使用设定阈值初步得到文本区域;最后对图像进行后处理,对文本区域的边缘进行提取和矫正,我们使用红色线条对文本区域进行了标记,如图 3-4(a)所示。
【学位授予单位】:北京工业大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:H214;TP391.41
【相似文献】
相关期刊论文 前10条
1 陈晰;;近代初期台湾史学界的重要工具书——《早期台湾历史文献研究书目》[J];中国索引;2011年01期
2 陈庆英;杨洁;;评《清代藏学历史文献研究》[J];西藏研究;2018年01期
3 赵凤华;;浅析历史文献在历史教学中的作用[J];中华少年;2017年19期
4 张子刚;;碑刻:研究地方社会发展不可或缺的历史文献[J];人口·社会·法制研究;2016年Z2期
5 刘敬林;《英藏敦煌社会历史文献释录》(第一卷)补校[J];敦煌研究;2004年02期
6 叶贵良;《英藏敦煌社会历史文献释录·斯63号〈太上洞玄灵宝无量度人上品妙经〉》校正[J];敦煌学辑刊;2002年02期
7 ;上图新馆将举办 “历史文献的开发与利用”学术研讨会[J];图书馆杂志;1997年03期
8 王继光;;蒙、藏、维吾尔族历史文献举要[J];史学史研究;1987年02期
9 ;历史文献[J];党史纵横;1988年07期
10 顾志华;;祁承r在历史文献整理工作中的贡献[J];华中师范大学学报(哲学社会科学版);1988年04期
相关会议论文 前10条
1 向燕南;;古城的保护与其可持续发展不应忽视历史文献的研究[A];《中国长城博物馆》2012年第3期[C];2012年
2 赵娅丽;范胜丽;;现代思维科学与东北地方历史文献研究[A];耕耘录:吉林省博物院学术文集(2003-2010)[C];2010年
3 张丕远;葛全胜;郑景云;;从历史文献、档案中提取自然环境信息的研究[A];中国经济史上的天人关系学术讨论会论文集[C];1999年
4 陈志根;;论湘湖历史文献的整理与研究[A];萧山记忆(第四辑)[C];2011年
5 林永祥;;福建省图书馆历史文献信息的收集与利用[A];福建省社会科学信息中心2005年年会论文集[C];2005年
6 周卫荣;;“搉石”考[A];面向21世纪的科技进步与社会经济发展(下册)[C];1999年
7 陈立;;载籍聚珍,含英咀华:南京图书馆历史文献阅读推广之路[A];中国图书馆学会年会论文集(2014年卷)[C];2014年
8 田玉南;;探析烟台地区历史文献开发利用的价值及其举措[A];文化研究论坛[C];2011年
9 张立宪;;溥仪珍宝迷踪[A];溥仪研究 创刊号[C];2011年
10 舒大刚;;汉代儒学文献的发展与演变[A];历史文献研究(总第31辑)[C];2012年
相关重要报纸文章 前10条
1 杭州师范大学马克思主义学院 方勇骏;加强民间历史文献研究[N];中国社会科学报;2019年
2 孙昌武;一部历史文献拾遗补缺之作[N];中华读书报;2018年
3 新乡市图书馆 吴敏卿;河南历史文献的整理与开发利用[N];新乡日报;2009年
4 记者葛锐;历史文献画册《中国卫生防疫50年》正式出版[N];中国中医药报;2002年
5 记者 章红雨;国图社40年披露5万余种珍稀历史文献[N];中国新闻出版广电报;2019年
6 厦门大学历史系 张侃;田野工作、历史文献与史学研究[N];光明日报;2007年
7 高放;珍贵革命历史文献的生动展现[N];人民日报;2007年
8 国家社科基金重大项目“英藏敦煌社会历史文献整理与研究”首席专家 首都师范大学教授 郝春文;《英藏敦煌社会历史文献释录》(1—11卷)出版[N];光明日报;2015年
9 记者 姜小玲;6700余种15000余册革命历史文献整理完成[N];解放日报;2011年
10 记者 庄建;新疆历史文献现“真身”[N];光明日报;2010年
相关博士学位论文 前1条
1 冯法强;近代江淮官话语音演变研究[D];南开大学;2014年
相关硕士学位论文 前10条
1 赵全超;藏文历史文献中粘连字丁串的切分与识别[D];北京工业大学;2019年
2 张西群;面向藏文历史文献的版面分割方法研究[D];北京工业大学;2018年
3 肖s
本文编号:2600429
本文链接:https://www.wllwen.com/wenyilunwen/yuyanyishu/2600429.html