学术论文格式检查和内容校对的研究

发布时间:2021-02-25 00:36
  学术论文是高等院校教学的重要环节,是高等院校教学质量的体现。学术论文的格式以及内容的规范性是学位论文质量的重要体现之一。为了减轻学生和指导老师在学术论文审查以及修改方面的负担,让学生和指导老师把更多的精力集中在论文的学术层面上,本文对学术论文格式和内容校对进行深入研究。本文的主要工作如下:(1)提出了格式检查算法。该算法包含基于最小编辑距离的页面匹配算法。格式检查算法先对待检测论文的文本信息进行提取;再利用基于最小编辑距离的页面匹配算法和正则表达式对论文结构的各个部分进行定位;然后提取论文结构的各个部分的格式信息与标准配置规则文件进行比对检查,实现论文文本的字体、字号、段落行间距、缩进、对齐方式等常规文本格式的检查以及章节编号、表编号、参考文献等特殊文本格式的检查;最后生成一个简洁准确的检查报告。(2)提出了基于LanguageTool中文内容校对的改进算法。该算法主要包含分词、基于规则库的校对和真词校对三个部分。在分词部分,本文对五个分词工具进行了测试分析,选择了ICTCLAS分词工具;在基于规则库校对部分,通过编写爬虫程序收集到3385个正误词语对并将收集到的词语对自动生成词语规则... 

【文章来源】:北京交通大学北京市 211工程院校 教育部直属院校

【文章页数】:75 页

【学位级别】:硕士

【部分图文】:

学术论文格式检查和内容校对的研究


图3-1页眉页脚检查内容??Figure?3-1?Header?Footer?Check?Content??

参考文献,前后间距,字号,行距


文参考文献比例、参考文献的格式是否正确等比较特殊的格式要求。??3.2格式检查算法架构??根据上一小节对论文格式要求的需求分析,得出格式检查程序的架构如图3-3??所示。??14??

架构图,架构,编辑距离,定位算法


图3-3格式检查算法的架构??Figure?3-3?Architecture?of?Format?Checking?Algorithms??由图3-3可知,格式检查程序分三个部分,分别是定位部分、格式以及特殊文??本提取部分和检查部分。定位部分是本文的一个研究重点,通过基于编辑距离的??定位算法和正则匹配实现论文结构各个部分的定位,包含封面的定位、页眉页脚??的定位、标题的定位、中文摘要的定位、目录的定位、图的定位、表的定位、正??文的定位、参考文献的定位等,具体的定位算法设计与实现见3.4小节;格式以及??特殊文本提取分为两个部分,第一个部分是提取学术论文里的文本格式,第二部??分是实现特殊文本内容的提取,包括目录的提取、标题和页码的提取、图名和页??码的提取、表名和页码的提取、参考文献和上标(即参考文献的引用顺序)的提??取;检查部分是通过提取论文格式以及特殊文本与标准论文格式进行对比生成错??误报告。??格式检查程序的三个部分之间存在联系并_且数据共享。格式检查的流程如图??3-4所示。??格式检查程序先读取一篇学术论文,用基于最小编辑距离的页面匹配算法依??次定位检查,首先定位封面并检查,定位授权书并检查,定位摘要并检查,定位??英文摘要并检查

【参考文献】:
期刊论文
[1]多种字符串相似度算法的比较研究[J]. 牛永洁,张成.  计算机与数字工程. 2012(03)
[2]基于规则与统计相结合的中文文本自动查错模型与算法[J]. 张仰森,曹元大,俞士汶.  中文信息学报. 2006(04)

硕士论文
[1]高中语文辨析与修改病句教学策略探究[D]. 陈杉杉.曲阜师范大学 2018
[2]学位论文格式检测系统设计与实现[D]. 陈渊博.大连理工大学 2017
[3]动态语法观视域下高考语病辨析题命题与解析问题研究[D]. 肖秀华.宁波大学 2017
[4]中文真词错误自动校对方法研究[D]. 顾德之.江苏科技大学 2017
[5]学位论文规范性评估系统的设计与实现[D]. 刘宝超.延边大学 2015
[6]多模板多格式论文综合校排系统的研究和实现[D]. 潘若瑛.上海交通大学 2014



本文编号:3050170

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3050170.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户af0b6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com