文档互操作性的自动评价方法研究
发布时间:2021-05-21 02:42
文档作为信息交换的载体,被广泛应用在各个领域,多种文档格式标准也应运而生。由于各个标准制定的出发点不同,它们之间的差异带来了很多文档互操作的问题。为使文档信息能够更好地保存与共享,提高文档格式标准以及文档处理系统间的互操作性显得十分重要。目前,文档互操作性评价工作主要通过人工评价完成,不仅费时费力,评价结果的准确性也无法得到保证。针对上述不足,一些研究中引入了度量函数、构建度量模型,通过量化的度量结果对互操作性进行评价。虽然这些方法使得评价结果在客观性和准确性上有所提升,但未能实现自动化。基于上述问题,本文对文档互操作性的自动评价方法进行了深入研究,探讨了流式文档之间的格式转换,以及流式文档到版式文档的格式转换的互操作性评价方法,重点研究了OOXML-UOF 2.0、UOF 2.0-OOXML、OOXML-OFD和UOF 2.0-OFD四种转换形式的互操作性。本文主要工作及创新成果如下:1)文档显现效果的自动化分析方法针对人工分析排版效果费时费力,结果不准确的问题,本文提出一种自动化颜色标注方法,用于建立版面元素与XML形式的流式文档的逆向关联;针对其他形式的流式文档以及版式文档的显现...
【文章来源】:北京信息科技大学北京市
【文章页数】:88 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.3 研究内容与创新点
1.4 论文组织结构
第2章 互操作性评价的研究框架与关键问题
2.1 总体框架
2.2 预处理涉及的关键问题
2.3 互操作性分析涉及的关键问题
2.4 本章小结
第3章 基于显现效果的文档互操作性分析
3.1 显现效果与文档互操作性评价的关系
3.2 版面对象与排版元素的逆向关联分析
3.2.1 逆向关联关系
3.2.2 基于颜色标注的方法
3.2.3 基于聚类的方法
3.2.4 实验及结果分析
3.3 排版效果分析
3.3.1 段落排版效果分析方法
3.3.2 表格排版效果分析方法
3.3.3 实验及结果分析
3.4 本章小结
第4章 基于编辑语义的文档互操作性分析
4.1 编辑语义与文档互操作性评价的关系
4.2 排版元素节点路径分析方法
4.3 实验及结果分析
4.4 本章小结
第5章 文档互操作性评价模型的构建
5.1 模型评价指标及其权重的计算
5.1.1 评价指标的选取
5.1.2 指标权重的计算
5.2 评价模型的构建
5.2.1 流式文档间的互操作性评价模型
5.2.2 流式文档到版式文档的互操作性评价模型
5.3 本章小结
第6章 实验分析与对比
6.1 实验结果分析
6.2 与人工分析的对比
6.3 本章小结
第7章 总结与展望
7.1 总结
7.2 展望
致谢
参考文献
附录 A 聚类方法特征提取示例
个人简历 在学期间发表的论文与研究成果
【参考文献】:
期刊论文
[1]基于层次分析法的电缆线路风险评估[J]. 吴明松,黄新波,朱永灿,蒋卫涛. 西安工程大学学报. 2019(06)
[2]基于PCA-AHP-IE的多指标评价模型研究与应用[J]. 王卫红,王园. 浙江工业大学学报. 2019(06)
[3]基于特征提取和机器学习的文档区块图像分类算法[J]. 李翌昕,邹亚君,马尽文. 信号处理. 2019(05)
[4]基于SVM的复杂版面分割方法[J]. 曾凡锋,许博臣. 电子技术与软件工程. 2018(10)
[5]K均值聚类算法的研究与优化[J]. 陶莹,杨锋,刘洋,戴兵. 计算机技术与发展. 2018(06)
[6]政府信息资源元数据语义互操作模式研究[J]. 董克,谢芳芳,张晓娟. 电子政务. 2017(08)
[7]基于关联数据的语义互操作研究[J]. 贾君枝,李捷佳. 情报理论与实践. 2017(08)
[8]基于社会建构主义的元数据语义互操作概念框架研究[J]. 俞力. 图书馆理论与实践. 2017(05)
[9]基于反馈合并的中英文混排版面OCR技术研究[J]. 任荣梓,高航. 计算机技术与发展. 2017(03)
[10]军事信息系统互操作能力评估方法研究[J]. 张雪松,苏辛,王燕敏. 中国电子科学研究院学报. 2016(06)
硕士论文
[1]电子出版物字体替代和字体识别方法研究[D]. 赵欢.北京信息科技大学 2018
本文编号:3198892
【文章来源】:北京信息科技大学北京市
【文章页数】:88 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.3 研究内容与创新点
1.4 论文组织结构
第2章 互操作性评价的研究框架与关键问题
2.1 总体框架
2.2 预处理涉及的关键问题
2.3 互操作性分析涉及的关键问题
2.4 本章小结
第3章 基于显现效果的文档互操作性分析
3.1 显现效果与文档互操作性评价的关系
3.2 版面对象与排版元素的逆向关联分析
3.2.1 逆向关联关系
3.2.2 基于颜色标注的方法
3.2.3 基于聚类的方法
3.2.4 实验及结果分析
3.3 排版效果分析
3.3.1 段落排版效果分析方法
3.3.2 表格排版效果分析方法
3.3.3 实验及结果分析
3.4 本章小结
第4章 基于编辑语义的文档互操作性分析
4.1 编辑语义与文档互操作性评价的关系
4.2 排版元素节点路径分析方法
4.3 实验及结果分析
4.4 本章小结
第5章 文档互操作性评价模型的构建
5.1 模型评价指标及其权重的计算
5.1.1 评价指标的选取
5.1.2 指标权重的计算
5.2 评价模型的构建
5.2.1 流式文档间的互操作性评价模型
5.2.2 流式文档到版式文档的互操作性评价模型
5.3 本章小结
第6章 实验分析与对比
6.1 实验结果分析
6.2 与人工分析的对比
6.3 本章小结
第7章 总结与展望
7.1 总结
7.2 展望
致谢
参考文献
附录 A 聚类方法特征提取示例
个人简历 在学期间发表的论文与研究成果
【参考文献】:
期刊论文
[1]基于层次分析法的电缆线路风险评估[J]. 吴明松,黄新波,朱永灿,蒋卫涛. 西安工程大学学报. 2019(06)
[2]基于PCA-AHP-IE的多指标评价模型研究与应用[J]. 王卫红,王园. 浙江工业大学学报. 2019(06)
[3]基于特征提取和机器学习的文档区块图像分类算法[J]. 李翌昕,邹亚君,马尽文. 信号处理. 2019(05)
[4]基于SVM的复杂版面分割方法[J]. 曾凡锋,许博臣. 电子技术与软件工程. 2018(10)
[5]K均值聚类算法的研究与优化[J]. 陶莹,杨锋,刘洋,戴兵. 计算机技术与发展. 2018(06)
[6]政府信息资源元数据语义互操作模式研究[J]. 董克,谢芳芳,张晓娟. 电子政务. 2017(08)
[7]基于关联数据的语义互操作研究[J]. 贾君枝,李捷佳. 情报理论与实践. 2017(08)
[8]基于社会建构主义的元数据语义互操作概念框架研究[J]. 俞力. 图书馆理论与实践. 2017(05)
[9]基于反馈合并的中英文混排版面OCR技术研究[J]. 任荣梓,高航. 计算机技术与发展. 2017(03)
[10]军事信息系统互操作能力评估方法研究[J]. 张雪松,苏辛,王燕敏. 中国电子科学研究院学报. 2016(06)
硕士论文
[1]电子出版物字体替代和字体识别方法研究[D]. 赵欢.北京信息科技大学 2018
本文编号:3198892
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3198892.html
最近更新
教材专著