当前位置:主页 > 社科论文 > 出版论文 >

利用VB读取方正排版文件提取元数据

发布时间:2018-04-22 19:43

  本文选题:网刊发布系统 + 元数据 ; 参考:《中国科技期刊研究》2015年06期


【摘要】:【目的】为科技期刊自动提取更加全面的元数据提供方法和借鉴。【方法】以方正排版文件为对象,建立了提取元数据的数学模型,同时提出尾部分割算法。然后利用基于对象的VB编程软件编写了自动提取元数据程序。【结果】在分析了方正排版语言特点之后,对方正排版文件进行了字符串替换处理,并建立了分割关键词列表文件,最后将提取的元数据保存到Excel文件中。【结论】实际应用表明,仅几秒钟就可以完成一期数据的提取工作,大大提高了工作效率。
[Abstract]:[objective] to provide a method and reference for automatic extraction of more comprehensive metadata from sci-tech journals. [methods] taking square typesetting file as an object, the mathematical model of extracting metadata is established, and the tail segmentation algorithm is proposed at the same time. Then using the object based VB programming software to write the automatic extraction metadata program. [results] after analyzing the characteristics of the square typesetting language, the other side of the forward typesetting file string replacement processing, Finally, the extracted metadata is saved to the Excel file. [conclusion] the practical application shows that the first phase of data extraction can be completed in only a few seconds, which greatly improves the working efficiency.
【作者单位】: 东北大学学报编辑部;
【分类号】:G230.7

【参考文献】

相关期刊论文 前6条

1 张科;王景发;;期刊网络采编系统研发及系统功能分析[J];大学图书馆学报;2008年04期

2 李朝光,张铭,邓志鸿,杨冬青,唐世渭;论文元数据信息的自动抽取[J];计算机工程与应用;2002年21期

3 狄涤,周竞扬,潘金贵;基于规则的HTML文档元数据提取[J];计算机工程;2004年09期

4 李效东,顾毓清;基于DOM的Web信息提取[J];计算机学报;2002年05期

5 曾月蓉;;方正排版中几个注解命令的巧用[J];科技编辑出版研究文集;2005年00期

6 周亚;;2001—2008年国内元数据自动抽取研究综述[J];科技情报开发与经济;2009年23期

【共引文献】

相关期刊论文 前10条

1 潘冲;周国民;;基于元数据的农业网站管理信息系统研究[J];安徽农业科学;2008年03期

2 张彦超;刘云;李勇;沈波;;基于自动生成模板的Web信息抽取技术[J];北京交通大学学报;2009年05期

3 廉捷;刘云;;网络舆情中的信息预处理与自动摘要算法[J];北京交通大学学报;2010年05期

4 高良才;汤帜;陶欣;房婧;;一种自动发现、分割与标注引文元数据的方法[J];北京大学学报(自然科学版);2010年06期

5 王茹,宋瀚涛,陆玉昌;基于树自动机的网页数据抽取[J];北京理工大学学报;2004年09期

6 王权;;基于B/S+C/S模式的期刊网络采编系统研究及其应用[J];图书与情报;2010年06期

7 张敏;;基于确定性树自动机技术的信息抽取研究[J];才智;2011年36期

8 张敏;;信息抽取技术在网页中的应用[J];中国城市经济;2011年20期

9 马瑞民;钱浩;;基于时间频率加权DOM的Web信息抽取方法[J];长江大学学报(自然科学版);2011年01期

10 崔琳;汪材印;;基于语义Web的Blog智能检索系统研究[J];长江大学学报(自然科学版);2011年10期

相关会议论文 前10条

1 翟伟斌;许榕生;;基于Internet的CIS研究[A];第十三届全国核电子学与核探测技术学术年会论文集(下册)[C];2006年

2 韩杰;廖闻剑;彭艳兵;;基于楼层分割的BBS信息提取[A];中国通信学会第六届学术年会论文集(上)[C];2009年

3 韩杰;廖闻剑;彭艳兵;;基于楼层分割的BBS信息提取[A];中国通信学会第六届学术年会论文集(中)[C];2009年

4 梁勇;张文;;网络舆情采集系统的设计[A];2011年全国通信安全学术会议论文集[C];2011年

5 张继红;陈小全;;海量交通安全数据的元数据管理研究[A];2010年第16届全国信息存储技术大会(IST2010)论文集[C];2010年

6 王文生;谢能付;;基于Web的农业信息自动抽取方法研究[A];中国农业信息科技创新与学科发展大会论文汇编[C];2007年

7 吕国英;冯艳;李茹;;基于中文框架语义的信息抽取研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

8 程淑;;科技期刊稿件采编系统的需求与应用——以《水电能源科学》杂志为例[A];竞争 合作 创新——科技期刊未来发展之路——第八届中国科技期刊发展论坛论文集[C];2012年

9 韩杰;廖闻剑;彭艳兵;;基于楼层分割的BBS信息提取[A];中国通信学会第六届学术年会论文集(中)[C];2009年

10 韩杰;廖闻剑;彭艳兵;;基于楼层分割的BBS信息提取[A];中国通信学会第六届学术年会论文集(上)[C];2009年

相关博士学位论文 前10条

1 吴承荣;骨干通道上的网络论坛通信信息监测和分析的关键技术研究[D];复旦大学;2011年

2 黄九鸣;面向舆情分析和属性发现的网络文本挖掘技术研究[D];国防科学技术大学;2011年

3 周明建;基于本体的开放式知识管理研究[D];浙江大学;2004年

4 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年

5 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年

6 胡国平;基于超大规模问答对库和语音界面的非受限领域自动问答系统研究[D];中国科学技术大学;2007年

7 周顺先;文本信息抽取模型及算法研究[D];湖南大学;2007年

8 董宝力;Web制造资源的语义发现关键技术研究[D];浙江大学;2007年

9 胡燕;基于Web信息抽取的专业知识获取方法研究[D];武汉理工大学;2007年

10 何慧;WEB文本挖掘中关键问题的研究[D];北京邮电大学;2009年

相关硕士学位论文 前10条

1 孙岭;一种基于前缀表达式的Web信息抽取方法的关键问题的实现[D];山东科技大学;2010年

2 雷斌;基于Java技术的智能化搜索引擎的研究与设计[D];哈尔滨工程大学;2010年

3 方少卿;Web就业信息抽取系统的实现研究[D];合肥工业大学;2010年

4 范春晓;基于XML的Web信息抽取技术研究[D];沈阳理工大学;2010年

5 杨鼎;基于朴素贝叶斯的中文文本情感倾向分类研究[D];湖南工业大学;2010年

6 谷文;基于概念树的Web信息抽取技术研究[D];长春工业大学;2010年

7 胡少荣;一种舆情信息预处理平台的研究与实现[D];北京交通大学;2010年

8 沙有闯;基于Web文本挖掘的网络口碑监测系统研究[D];安徽大学;2010年

9 孙亚南;网站实时时序数据采集系统的设计与实现[D];西安电子科技大学;2010年

10 陈晶;基于网页的信息抽取的研究[D];西安工业大学;2011年

【二级参考文献】

相关期刊论文 前10条

1 刘金红,夏阳,陆余良;基于Ontology的网络元数据抽取系统的研究与实现[J];安徽电子信息职业技术学院学报;2004年Z1期

2 杨桂莲;;基于C/S、B/S结构的数字图书馆网络安全防护策略[J];图书与情报;2007年02期

3 袁平,韩景润,党海飞;空间元数据自动生成技术研究[J];地理信息世界;2005年01期

4 杜晓;晋佩东;郭大海;王建超;周英杰;;遥感影像快速入库和元数据提取系统的研究[J];国土资源遥感;2006年03期

5 蒲晓妮;;高职院校程序设计课程实践教学方案设计案例[J];哈尔滨职业技术学院学报;2011年02期

6 朱玲;;学位论文元数据的制定和自动提取[J];华南金融电脑;2008年12期

7 陈翔;;基于B/S的期刊稿件管理系统的设计和实现[J];杭州师范学院学报(自然科学版);2006年01期

8 李胜利;李昌清;袁平鹏;刘英书;;基于Web的电子期刊元数据信息抽取方法[J];华中科技大学学报(自然科学版);2007年12期

9 叶健华;黎峰;;“项目驱动+案例教学”模式在C语言教学中的应用[J];济南职业学院学报;2009年03期

10 陈国光,丁晓青,彭良瑞;一个基于规则的图书逻辑结构提取算法[J];计算机工程与应用;2002年19期

【相似文献】

相关期刊论文 前1条

1 周怡;胡大卫;段学俭;张世军;张莹莹;章琢之;吴弃疾;;元数据:数字出版发展的根基[J];编辑学刊;2011年05期



本文编号:1788635

资料下载
论文发表

本文链接:https://www.wllwen.com/shekelunwen/chubanfaxing/1788635.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9dc6e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com