基于打印指令的打印数据文本信息的提取和追加

发布时间:2017-08-05 03:08

  本文关键词:基于打印指令的打印数据文本信息的提取和追加


  更多相关文章: Postscript EMF 假脱机文件 打印指令


【摘要】:随着互联网的普及,大数据概念应运而生,与此同时各种数据采集方式也相继出现。除去平时常见的网页爬虫、网卡过滤等数据采集方法之外,打印机数据采集的需求也越来越多。毫无疑问,数据采集是大数据分析的基础工作。最早的数据采集出现在工业时代的自动控制和环境监测领域,后来发展到电子证据领域,而如今数据采集作为大数据分析的基础性工作,在互联网领域中的地位举足轻重。互联网中的数据有多种来源,包括客户机使用记录、系统日志、网络流量监控、邮件信息、硬盘文件、浏览器缓存数据、聊天记录等。打印机数据采集的需求出现较晚,它是随着互联网支付的出现而出现的,特别是在020概念普及之后,很多实体店都开始尝试使用线上支付的经营策略。尤其是对于那些先消费后支付的商店而言,获取客户的已消费信息就非常重要。如果要对目前存在的客户管理系统增加支付功能就只能从账单打印这一环节入手,因为各种管理系统的实现千差万别,消费信息获取太过复杂,所以要获取客户消费信息只能从分析待打印的客户账单(打印缓冲文件)中得到,原因在于相比于各种管理系统的种类数量而言,打印机的种类数量要少的多。因此从软件通用的角度来讲,消费信息的采集可以从打印机入手,而对各种打印指令翻译也就变得越来越迫切。本文从Windows操作系统的打印机制入手,分别以Windows标准假脱机文件(EMF)和与打印机相关的假脱机文件(以Postscript打印指令为例)为研究对象,在现有指令解析相关研究的基础上,提出了基于DRAW16的EMF文件解析算法,以及将标准文本或者图片转换为PostScript打印指令的转换算法。本文针对EMF矢量文字识别中遇到的各种问题均提出具体的解决方案,包括训练集和测试集的选取、矢量特征提取、多文字记录识别方式等。在标准文本或图片转换成打印指令的过程中也涉及到了多个方面的问题,比如PostScript坐标转换、分辨率设定、字库创建等。本文的研究成果对有效解决这类打印机指令翻译以及追加有积极的推进作用。
【关键词】:Postscript EMF 假脱机文件 打印指令
【学位授予单位】:中国海洋大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.1
【目录】:
  • 摘要5-6
  • Abstract6-11
  • 1 绪论11-17
  • 1.1 课题研究背景11-12
  • 1.2 课题研究目标和意义12-13
  • 1.2.1 课题研究目标12
  • 1.2.2 课题研究意义12-13
  • 1.3 打印数据解析的国内外研究现状13-15
  • 1.3.1 EMF解析研究现状14
  • 1.3.2 PostScript解析研究现状14-15
  • 1.4 本文结构15-17
  • 2 Windows系统打印原理和打印数据获取17-27
  • 2.1 Windows打印原理17-21
  • 2.1.1 图形设备接口(GDI)18-19
  • 2.1.2 Windows字体库介绍(TTF)19
  • 2.1.3 假脱机系统(Spooling)19-20
  • 2.1.4 Windows系统假脱机打印流程20-21
  • 2.2 打印数据的获取21-25
  • 2.2.1 打印数据的分类21-22
  • 2.2.2 标准假脱机文件(EMF)打印内容获取22-24
  • 2.2.3 原始打印类型的假脱机文件(PostScript)打印内容获取24-25
  • 2.3 本章小结25-27
  • 3 基于DRAW16的EMF文件格式解析研究27-49
  • 3.1 EMF文件格式解析方法研究27-41
  • 3.1.1 EMF文件格式介绍27-29
  • 3.1.2 EMF记录类型分析29-30
  • 3.1.3 EMF文本提取方法研究30-41
  • 3.2 输出文本属性转换算法研究41-45
  • 3.2.1 EMF文本信息输出格式41-42
  • 3.2.2 属性转换算法设计及实现42-45
  • 3.3 DRAW16的EMF解析算法仿真分析45-46
  • 3.3.1 测试工具设计45
  • 3.3.2 测试结果展示45-46
  • 3.4 本章小结46-49
  • 4 PS文件追加方法研究与实现49-79
  • 4.1 PS文件机制分析49-69
  • 4.1.1 PS数据对象50-51
  • 4.1.2 PS栈51-52
  • 4.1.3 PS对象的存储机制52-53
  • 4.1.4 PS常用操作符53-56
  • 4.1.5 PS单色位图显示机制56-59
  • 4.1.6 PS文本显示机制59-61
  • 4.1.7 PS字库解码方式研究61-69
  • 4.2 PS信息追加方法研究69-74
  • 4.2.1 PS单色位图追加研究和实现69-71
  • 4.2.2 PS文本信息追加研究和实现71-74
  • 4.3 PS信息追加算法仿真测试74-78
  • 4.3.1 测试工具展示74-76
  • 4.3.2 测试结果展示76-78
  • 4.4 本章小结78-79
  • 5 总结和展望79-81
  • 5.1 论文总结79
  • 5.2 研究展望79-81
  • 参考文献81-83
  • 附录183-89
  • 附录289-93
  • 致谢93-95
  • 个人简历95

【相似文献】

中国期刊全文数据库 前10条

1 张利;计算机打印数据的硬件截取[J];电子技术;1998年01期

2 许再由;;打印数据的中断与恢复[J];微型机与应用;1990年07期

3 沈泓;从并口读出打印数据[J];电子计算机与外部设备;1999年03期

4 刘德营,康敏;一种截取计算机打印数据的接口电路设计[J];农机化研究;2002年04期

5 卢正东;漫谈计算机管理档案(五)——在Access2000数据库中打印数据[J];四川档案;2001年06期

6 摆卫兵;如何用Visua C++实现在对话框中打印数据[J];电脑开发与应用;2002年04期

7 龚戈峰;陈安;胡跃明;;基于CPLD的打印数据采集系统[J];微计算机信息;2008年11期

8 ;实用方案[J];信息系统工程;2001年10期

9 李维平;;VFP编程方法打印数据报表[J];电脑编程技巧与维护;2012年14期

10 于明鑫;;如何利用ADO.NET技术打印报表[J];辽宁师专学报(自然科学版);2010年03期

中国重要报纸全文数据库 前3条

1 ;移动互联,随时打印[N];电脑报;2014年

2 ;打印A3幅面仅需4秒钟[N];中国计算机报;2006年

3 玄武;PictBridge和PhotoPC DIRECT的技术介绍与应用前景[N];中国电脑教育报;2003年

中国硕士学位论文全文数据库 前2条

1 李培然;基于打印指令的打印数据文本信息的提取和追加[D];中国海洋大学;2015年

2 贾斌;医学影像按需打印系统关键技术研究[D];华南理工大学;2013年



本文编号:622885

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/622885.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户95488***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com