多模板多格式论文综合校排系统的研究和实现
发布时间:2017-09-08 00:26
本文关键词:多模板多格式论文综合校排系统的研究和实现
更多相关文章: 多模板 多格式 校排 OLE自动化 MVC框架
【摘要】:随着学术界对论文内容质量的要求的日益提高,各大期刊杂志和高校院系对论文格式的规范性标准也日趋严格。由于论文的海量性和模板的多样性,利用人工排版和审阅检查的方式费时费力,也不能保证准确性。 针对这个问题,研究并设计出一个多模板多格式的论文综合校排系统。系统利用OLE Automation技术,针对目前学术界论文常用的软件和格式——以MicrosoftOffice为代表的word文件,,以LaTex为代表的Tex排版软件,以及常用的导出格式PDF便携文件,进行文档的二次开发。根据不同出处论文模板的格式规范要求,完成从模板样张文件导入、标准模板格式导出,到论文格式校验提示、论文自动排版输出的综合功能,实现“多模板”“多格式”的交互性和延展性,旨在方便、快捷、灵活地实现论文格式校验和排版的自动化工作,提高工作效率和准确率,方便论文写作者和审核人员。基本功能涵盖论文标题、摘要、关键词、目录、各级标题、正文、图表注释、引文等项目的字体、字号、加粗、行间距、段落前后间距和空行数要求等属性的检测、报错提示和自动更正;通过对扩展需求的分析和优化算法的研究和应用,拓展功能实现简单的标点符号检测和关键词检测、面向章节编号处理、引文处理、图表位置处理和折半查找加经验学习的优化工作,进一步提高系统性能,最终达到论文的自动化综合校排的目标。 目前,论文研究的综合校排系统已经完成开发并投入到上海交通大学计算机系工程硕士办公室的论文格式审核和排版的应用中,检测了近百篇论文,对格式错误的查准率和查全率达到令人满意的水平,运行稳定,效果良好。
【关键词】:多模板 多格式 校排 OLE自动化 MVC框架
【学位授予单位】:上海交通大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP311.52
【目录】:
- 摘要3-4
- ABSTRACT4-11
- 第一章 绪论11-14
- 1.1 项目意义及背景11-12
- 1.2 研究目的与主要内容12-13
- 1.3 本文结构13-14
- 第二章 相关技术14-25
- 2.1 OLE Automation 技术14-16
- 2.1.1 OLE Automation 概念14-15
- 2.1.2 OLE Automation 主要功能特点15
- 2.1.3 OLE Automation 技术实现15-16
- 2.2 Word 架构16-19
- 2.2.1 Word 功能特性16-17
- 2.2.2 Word 对象模型和组件架构17-18
- 2.2.3 Word 服务器接口18-19
- 2.3 Tex 原理19-20
- 2.4 PDF 接口20-21
- 2.5 C#环境平台21
- 2.6 MVC 框架21-23
- 2.7 Template Method 设计模式23-24
- 2.8 本章小结24-25
- 第三章 基于 MVC 的系统设计25-40
- 3.1 基于 MVC 的整体架构25-28
- 3.2 底层模型层(Model)的设计28-35
- 3.2.1 基于 Template Method 设计模式的设计28-30
- 3.2.2 模板处理部分的设计30-33
- 3.2.3 待测论文处理部分的设计33-35
- 3.3 视图表示层(View)的设计35-37
- 3.4 逻辑控制层(Controller)的设计37-38
- 3.5 辅助数据层的设计38-39
- 3.6 本章小结39-40
- 第四章 格式校排功能实现40-60
- 4.1 多模板多格式化40-42
- 4.2 基于 MS Word 的模板处理与格式校排42-49
- 4.2.1 C#环境下 OLE 技术对 Word 的控制42-44
- 4.2.2 Word 模板处理44-47
- 4.2.3 Word 格式校排47-49
- 4.3 基于 LaTex 的模板制作49-50
- 4.3.1 LaTex 模板49
- 4.3.2 LaTex 模板的自动生成49-50
- 4.4 基于 PDF 的格式校验50-53
- 4.4.1 C#环境下 OLE 技术对 PDF 的控制50-51
- 4.4.2 PDF 格式信息读取51-52
- 4.4.3 PDF 格式校验52-53
- 4.5 无格式文件的从零排版53-57
- 4.5.1 无格式文件的读取53-54
- 4.5.2 无格式文件自动排版54-56
- 4.5.3 无格式文件中图表的处理56-57
- 4.6 问题讨论与解决57-59
- 4.6.1 Word 格式论文校排中的问题处理57-58
- 4.6.2 PDF 格式论文检测中的问题处理58-59
- 4.7 本章小结59-60
- 第五章 内容检测功能实现60-66
- 5.1 文本预处理与标点符号检测60-61
- 5.2 简单的关键词检测61-63
- 5.2.1 关键词提取的主要步骤62
- 5.2.2 词语的权重计算62-63
- 5.3 章节编号的处理63-64
- 5.4 引文的处理64-65
- 5.5 本章小结65-66
- 第六章 效果分析、优化与改进66-71
- 6.0 系统运行效果分析66
- 6.1 图片与表格位置的处理66-68
- 6.2 折半查找与经验学习68-70
- 6.2.1 大批量格式的折半查找68-69
- 6.2.2 经验学习69-70
- 6.2.3 折半查找与经验学习的应用效果70
- 6.3 本章小结70-71
- 第七章 总结与展望71-73
- 参考文献73-77
- 致谢77-78
- 攻读学位期间发表的学术论文目录78-81
- 附件81
【参考文献】
中国期刊全文数据库 前10条
1 刘衍珩;胡慧研;朱建启;;基于OLE接口的自动化Microsoft Project系统[J];吉林大学学报(信息科学版);2010年02期
2 党峥,汪晓庆;Windows下的OLE自动化技术及其实现[J];电脑与信息技术;1998年02期
3 谢俊;;题库管理系统中OLE技术对WORD的控制实现[J];电脑知识与技术;2009年36期
4 高乐;赵永生;;基于OLE Automation技术实现MS Word在上位机软件中的应用[J];湖南电力;2006年02期
5 蒋志华;Office编程中的对象模型以及获取代码的帮助[J];计算机辅助工程;2001年03期
6 叶明;张诤;;基于C#.NET的Word报告生成功能开发[J];计算机工程与应用;2008年09期
7 汤克明;陈];;Word服务器的接口解析与文档属性提取[J];计算机工程与应用;2008年28期
8 黎永良,崔杜武;MVC设计模式的改进与应用[J];计算机工程;2005年09期
9 刘泉;赵晓明;;基于模板方法的JDBC API的抽象封装与实现[J];计算机应用;2006年09期
10 孙少斌,花传杰;OLE技术及其应用[J];计算机应用;1997年05期
本文编号:810801
本文链接:https://www.wllwen.com/wenshubaike/hetongwenben/810801.html