当前位置:主页 > 法律论文 > 治安法论文 >

基于文本行几何失真的打印文档来源取证技术

发布时间:2017-11-02 01:29

  本文关键词:基于文本行几何失真的打印文档来源取证技术


  更多相关文章: 打印文档来源取证 页面文本行几何失真 页面文本行斜率 页面文本行间隔 虚拟页面文本行间隔


【摘要】:数字化已经渗透到我们生活的每一个角落。在数字世界中,保护不同形式内容版权和验证其真实性是非常重要的。本文研究的保护对象是我们日常工作和学习中经常接触的打印文档。由于打印文档相关的违法犯罪活动逐年增多,司法部门和情报机关迫切需要打印文档取证技术。近年来只利用扫描仪和计算机的数字被动无损取证技术应运而生,成为国际上备受关注的多媒体信息安全前沿领域。设备来源取证是数字被动无损取证技术中的一个主要问题,不依赖于专业设备和人员的打印文档来源取证(打印机识别)方法可以提高取证效率、降低取证成本且对原始文档不会造成破坏。针对目前打印文档来源取证领域存在的技术难题,本文重点研究对墨粉浓度和噪声变化鲁棒的文档检测方法,提出的方法不需要人工通过OCR软件恢复待测文档的理想图像,并且对于局部打印文档也具有较高取证准确率、可以识别相同品牌、相同型号、不同个体打印机。针对打印文本的分析,提出页面文本行几何失真特征。理想文档中文本行是平行的,但由于打印机存在机械装置缺陷,导致打印文档存在页面几何失真。通过实验发现在一个打印文档中,每个文本行存在一个微小的倾斜角度,各文本行间不再平行。页面文本行斜率沿着打印方向以特定模式变化,这种变化模式是独特的,随着打印机品牌、型号和打印机个体不同而变化,因而提出页面文本行几何失真特征。这是一种在打印中不可避免地被引入的特征,所以可作为打印机的固有特征。针对特定局部区域打印文档的取证,提出页面文本行斜率序列(PTLS)和页面文本行间隔序列(PTLI)以描述页面水平方向和垂直方向几何失真特征;针对任意局部区域打印文档的取证,提出虚拟页面文本行间隔序列(VPTLI)特征。然后根据提出的序列匹配距离分别度量两个长度不同的序列的相似度,最后提出相应的打印文档来源取证算法来判定文档页面来源。本文的取证算法对来自3个品牌,8个型号的10台打印机(其中3台为同一型号)的打印文档进行了满页和非满页文档的取证,表现最好的算法的平均准确率在92.82%到94.51%之间。提出的方法不仅克服取证中对墨粉浓度和噪声的敏感,同时避免了已有几何失真取证中必须获得理想样本的局限性,能够识别个体打印机,并且在非满页局部打印的情况下也获得了较高准确率。
【关键词】:打印文档来源取证 页面文本行几何失真 页面文本行斜率 页面文本行间隔 虚拟页面文本行间隔
【学位授予单位】:大连理工大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.1;D918.2
【目录】:
  • 摘要4-5
  • Abstract5-9
  • 1 绪论9-14
  • 1.1 研究背景和意义9
  • 1.2 研究现状9-11
  • 1.3 本文贡献11-13
  • 1.4 本文章节安排13-14
  • 2 打印文档来源取证方法概述14-25
  • 2.1 打印机工作原理14-15
  • 2.2 基于字符统计特征来源取证15-20
  • 2.3 基于几何失真特征来源取证20-22
  • 2.4 现有文档来源取证方法分析22-24
  • 2.5 本章小结24-25
  • 3 针对特定局部区域的打印文档来源取证25-39
  • 3.1 算法框架25-26
  • 3.2 预处理26-27
  • 3.3 文本行几何失真特征提取27-31
  • 3.3.1 PTLS特征提取27-29
  • 3.3.2 PTLI特征提取29-31
  • 3.4 序列匹配距离31-32
  • 3.5 文档来源取证算法32-34
  • 3.5.1 单特征文档来源取证算法32-33
  • 3.5.2 特征文档来源取证算法33-34
  • 3.6 实验与结果34-38
  • 3.6.1 算法实验与结果35-36
  • 3.6.2 对比实验与结果36-37
  • 3.6.3 打印机性能比较37-38
  • 3.7 本章小结38-39
  • 4 针对任意局部区域的打印文档来源取证39-47
  • 4.1 算法框架39-40
  • 4.2 文本行几何失真特征提取40-41
  • 4.2.1 VPTLI特征由来40
  • 4.2.2 VPTLI特征提取40-41
  • 4.3 文档来源取证算法41-43
  • 4.3.1 单特征文档来源取证算法41-42
  • 4.3.2 特征文档来源取证算法42-43
  • 4.4 实验与结果43-46
  • 4.4.1 算法实验与结果44-45
  • 4.4.2 对比实验与结果45
  • 4.4.3 打印机性能比较45-46
  • 4.5 本章小结46-47
  • 结论47-49
  • 参考文献49-53
  • 攻读硕士学位期间发表学术论文情况53-54
  • 致谢54-55

【参考文献】

中国期刊全文数据库 前10条

1 尚士泽;孔祥维;尤新刚;;伪造变造文件数字被动无损取证技术综述[J];信息网络安全;2015年04期

2 唐畅;黎建彬;;同一台打印机二次打印文件检验1例[J];刑事技术;2010年06期

3 庄琳;潘光程;;运用Photoshop软件检验追加打印文件[J];湖南公安高等专科学校学报;2010年05期

4 刘建华;章峰;;打印特征在识别变造文件中的应用[J];刑事技术;2010年04期

5 陈宁;张晓霞;张建华;廖广军;张卫红;;拉曼光谱技术及其在物证鉴定中的应用[J];中国人民公安大学学报(自然科学版);2009年02期

6 李江春;;利用暗记特征鉴别彩色激光打印、复印文件[J];刑事技术;2009年01期

7 周云玲;胡爱华;;目前文件检验工作中面临的难点问题[J];刑事技术;2007年01期

8 陈春涛;裴雷;;施乐DocuColor彩色激光打印机隐含信息的获取[J];江苏警官学院学报;2006年06期

9 王迪;黄敏静;;喷墨打印文件检验研究[J];广东公安科技;2006年01期

10 刘宁;;喷墨打印机种鉴别方法及流程[J];江苏警官学院学报;2005年06期

中国硕士学位论文全文数据库 前1条

1 王常有;基于固有特征的复印文档取证研究[D];大连理工大学;2013年



本文编号:1129418

资料下载
论文发表

本文链接:https://www.wllwen.com/falvlunwen/fanzuizhian/1129418.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户15961***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com