学位论文规范性评估系统的设计与实现
发布时间:2017-09-12 07:39
本文关键词:学位论文规范性评估系统的设计与实现
更多相关文章: 文本格式检测 OLE技术 模板匹配 信息抽取
【摘要】:学位论文是研究生在校期间学习、实践与研究成果的重要表现形式,也是授予学位的主要依据。学位论文作为特定的学术论文体裁,具有指定的格式规范,规范性是评价学位论文质量的重要内容之一。目前学位论文的规范性检查还不能完全自动化,不同程度地依赖于人工处理,这种方式费时费力而且容易出现错误。为解决这一问题,我们开发了学位论文规范性评估系统,实现了学位论文规范性的自动化检测。系统采用基于MFC程序框架和OLE文档处理技术相结合的设计方案,实现从外部接口对Word文档进行读取,操作过程中只需导入标准格式论文(模板论文)和待检测论文,系统就会实现对论文格式的自动化检测,最终给出检测结果报告。首先,系统对给定论文按模板论文格式标准进行检测。包括文本格式检测、章节顺序检测、图/表/公式标号顺序检测。在参考文献格式检测模块中,我们提出了一种基于规则的参考文献命名实体抽取方法和参考文献引用顺序检测算法并将其应用在系统中,实现了文献格式规范性的检查和正文中文献引用顺序的检测。其次,系统对论文进行基础数据统计。包括论文结构要素识别、论文各章字数和页数、论文字数、不同文字数、参考文献数量、中英文参考文献比例和参考文献引用年代统计等。最后,系统对论文进行词性分布合理性评价。采用自然语言统计处理方法对给定学位论文的词性分布情况进行统计,通过动态链接库的方式,调用分词系统,统计论文中名词、动词、形容词、介词、副词、代词出现的比率,以判定论文词性分布特征是否具有典型性。测试表明,系统各功能模块运行符合设计要求,而且各功能之间数据衔接正常,能够生成反映学位论文质量因素的检测结果报告,通过与人工检查结果进行对比,系统在保证检测准确率的前提下,大大提高工作效率。通过对两届研究生学位论文测试运行,本系统各部分功能逐渐得到了完善,可以将其应用在学位论文自动化检测工作中。
【关键词】:文本格式检测 OLE技术 模板匹配 信息抽取
【学位授予单位】:延边大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.1
【目录】:
- 摘要7-8
- Abstract8-14
- 第1章 绪论14-20
- 1.1 研究目的及意义14-15
- 1.2 国内外研究现状15-18
- 1.2.1 论文格式检测系统现状15-16
- 1.2.2 自然语言文本评价方法及其研究现状16-17
- 1.2.3 文档格式处理相关产业发展现状17-18
- 1.3 主要研究内容及工作18-19
- 1.4 本文结构19-20
- 第2章 文本文档规范分析技术基础20-31
- 2.1 引言20
- 2.2 文档分析处理相关技术20-25
- 2.2.1 Office文档的读取方法20-21
- 2.2.2 文档操作OLE技术21-23
- 2.2.3 Word文档分析技术23
- 2.2.4 MFC框架技术23-25
- 2.3 自然语言文本表示与相似性度量25-28
- 2.3.1 向量空间模型25-27
- 2.3.2 文本相似度度量27-28
- 2.4 信息抽取技术28-30
- 2.4.1 基于NLP的信息抽取28-29
- 2.4.2 基于规则的信息抽取29
- 2.4.3 基于统计的信息抽取29-30
- 2.5 软件测试方法30
- 2.6 本章小结30-31
- 第3章 系统设计与功能实现31-48
- 3.1 引言31
- 3.2 系统设计目标31-34
- 3.2.1 系统功能需求分析31-33
- 3.2.2 系统性能需求分析33
- 3.2.3 系统可行性分析33-34
- 3.3 系统体系构架34-36
- 3.4 系统输入输出设计36-38
- 3.4.1 论文标准格式模板36
- 3.4.2 模板格式样式表36-37
- 3.4.3 检测报告单37-38
- 3.5 参考文献格式检测方案38-46
- 3.5.1 参考文献模型化处理38-41
- 3.5.2 参考文献分类41
- 3.5.3 参考文献命名实体划分41-42
- 3.5.4 改进的互激励实体验证算法设计42-44
- 3.5.5 参考文献文中引用顺序检测算法44-46
- 3.6 词性分布分析46-47
- 3.7 本章小结47-48
- 第4章 系统测试48-55
- 4.1 引言48
- 4.2 系统功能测试48-51
- 4.2.1 参考文献格式检测功能测试49-50
- 4.2.2 参考文献引用顺序检测功能测试50
- 4.2.3 词性分布统计功能测试50-51
- 4.3 输出检测报告单51-52
- 4.4 系统试运行52-54
- 4.5 本章小结54-55
- 结论55-56
- 参考文献56-60
- 攻读硕士学位期间发表的论文60-61
- 致谢61
【参考文献】
中国期刊全文数据库 前9条
1 仇睿恒;汤帜;;一种在电子出版中融合固定版面与流式信息的方法[J];电子学报;2012年11期
2 吴文;;基于ASP及VBA技术实现毕业论文格式规范自动化[J];黄山学院学报;2010年05期
3 梁吉光;田俊华;姜杰;;基于改进HMM的文本信息抽取模型[J];计算机工程;2011年20期
4 张炜;赵浩婕;;基于SSH的高校科研量信息化管理平台的实现[J];科技信息;2009年16期
5 王灿辉;张敏;马少平;;自然语言处理在信息检索中的应用综述[J];中文信息学报;2007年02期
6 唐心亮;王靖;王震洲;;基于马尔科夫链模型的论文格式审查系统[J];河北科技大学学报;2012年05期
7 程萍;陈静;;研究生学位论文质量过程监控系统设计与实现[J];武汉理工大学学报(信息与管理工程版);2007年03期
8 李莉;王忠民;苑庆涛;;基于WEB的本科毕业设计管理平台设计与运行[J];西安邮电学院学报;2011年04期
9 阚运奇;;毕业论文格式检测系统的设计与研究[J];无线互联科技;2012年11期
,本文编号:835951
本文链接:https://www.wllwen.com/wenshubaike/xindetihui/835951.html
最近更新
教材专著