提取方正排版文件广义元数据并生成全文HTML的探索
发布时间:2017-12-21 03:09
本文关键词:提取方正排版文件广义元数据并生成全文HTML的探索 出处:《中国科技期刊研究》2016年02期 论文类型:期刊论文
更多相关文章: 广义元数据 方正BD排版语言 VB编程软件 自动全文提取 HTML文件
【摘要】:【目的】实现自动提取科技期刊全文元数据并生成HTML文件。【方法】以方正排版文件为对象,在可以提取出来文章的标题、摘要等元数据的基础上,将文章的正文内容元数据化,提出了包含图、表、公式等的广义元数据概念,并建立了提取图、表元数据的提取规则,同时将方正排版数学公式转化为La Te X表达式。然后利用VB编程软件编写了自动提取广义元数据程序并将元数据重新组合生成HTML格式的文件。【结果】根据方正BD排版语言的特点,建立的提取规则能有效提取全文并元数据化,最后可直接生成HTML文件。【结论】实际应用表明了利用广义元数据生成HTML文件的有效性和可行性。
【作者单位】: 东北大学学报编辑部;
【基金】:辽宁省社会科学规划基金资助项目(L12DXW011)
【分类号】:G230.7
【正文快照】: 东北大学学报编辑部,辽宁省沈阳市和平区文化路三巷11号110819目前,科技期刊的元数据[1]主要包含在网刊中提供标题、作者、中英文摘要、关键词及参考文献等信息,这些信息基本包含了文章的研究内容和大致的研究方法以及结果。但是由于信息量偏少,并不能完全体现论文的全部信息,
【相似文献】
中国期刊全文数据库 前1条
1 周怡;胡大卫;段学俭;张世军;张莹莹;章琢之;吴弃疾;;元数据:数字出版发展的根基[J];编辑学刊;2011年05期
,本文编号:1314445
本文链接:https://www.wllwen.com/shekelunwen/chubanfaxing/1314445.html