一种基于网页信息抽取的OA期刊资源采集方法研究
本文选题:OA期刊 切入点:OA期刊资源采集 出处:《数字图书馆论坛》2017年05期
【摘要】:本文结合开放获取期刊(Open Access Journal,OA期刊)资源特点,针对无法通过OAI-PMH协议进行资源采集的OA期刊,提出一种基于网页信息抽取的资源采集策略。本文从网页资源描述的角度总结OA期刊资源特点并对其分类。基于网页信息抽取方法在OA期刊资源采集适用性,提出一种基于OA期刊网页元数据抽取的采集方法,并在此方法的基础上设计了采集系统。通过对国内外不遵循OAI-PMH协议的10本OA期刊的网站实证采集,得到45 785篇论文的元数据,证明该采集方法能有效地应用于此类资源采集。研究丰富了OA期刊资源采集方式,对不遵循OAI-PMH协议的OA期刊资源采集提供方法借鉴。
[Abstract]:This combination of Open Access Journals (Open Access Journal, OA Journal) resources characteristics, for OA journals can not through the OAI-PMH protocol for resource acquisition, this paper proposed a resource acquisition strategy of Web Information Extraction Based on Web resources. From the description of the summary OA journal resource characteristics and the classification of Web information extraction method based on acquisition. The applicability of OA in periodical resources, put forward a method of acquisition OA Journal Web metadata extraction based on the basis of this method, the design of acquisition system. Through the acquisition of domestic and foreign empirical website does not follow the OAI-PMH protocol of the OA 10 journals, 45785 papers metadata, show that the acquisition method can be effectively used in this study enriches the way of resource acquisition. OA journal resource collection, provide a way for OA journal resource collection does not follow the OAI-PMH protocol.
【作者单位】: 中国农业科学院农业信息研究所;
【分类号】:G255.2
【参考文献】
相关期刊论文 前8条
1 王思丽;马建玲;王楠;李慧佳;;开放知识资源的元数据自动采集策略研究[J];图书馆学研究;2013年12期
2 郭少友;;OAI-PMH元数据的关联数据化方法研究[J];图书情报工作;2011年02期
3 朱江;尚玮姣;姜恩波;柴苗岭;黄筱瑾;;会议文献开放资源采集与服务系统的建设[J];情报理论与实践;2010年07期
4 徐方;张静;;国内OAI-PMH协议研究综述[J];现代情报;2009年01期
5 蒲筱哥;;基于Web的信息抽取技术研究综述[J];现代情报;2007年10期
6 王芳;王小丽;;基于OAI协议的数字档案馆元数据互操作问题研究[J];现代图书情报技术;2007年03期
7 李勇文;OAI元数据搜索引擎的设计与实现[J];现代图书情报技术;2005年02期
8 董慧,丁波涛;用OAI-MHP协议解决数字图书馆互操作问题[J];情报科学;2004年06期
相关硕士学位论文 前4条
1 宋辰;科技情报采集系统的设计及其快速文本聚类方法研究[D];北京工业大学;2014年
2 于静;基于页面主体提取的WEB信息抽取技术研究[D];南京邮电大学;2013年
3 杨东清;开放获取期刊资源库共建共享平台的研究与开发[D];南京农业大学;2010年
4 董娟;基于页面结构分析的网页信息抽取方法研究[D];中国石油大学;2010年
【共引文献】
相关期刊论文 前10条
1 柯平;刘旭青;柴峗;;省级公共图书馆评估标准解读[J];图书馆;2017年06期
2 马丽波;;新媒体环境下高校图书馆“微”服务[J];农业图书情报学刊;2017年06期
3 张雅琪;杨娜;李诣斐;柯平;;面向数字图书馆的公共图书馆评估[J];数字图书馆论坛;2017年05期
4 宋海艳;郭晶;董珏;;高校图书馆深度知识服务流程框架与实现路径研究[J];图书情报工作;2017年05期
5 黄如花;苗淼;;中美公共图书馆评估异同研究[J];图书馆建设;2017年05期
6 张莉;;E-Research环境下高校图书馆嵌入式知识服务模式研究[J];图书馆学刊;2017年03期
7 康英;;教学研究型大学图书馆发展的文化认知[J];边疆经济与文化;2017年05期
8 陈可彦;谭必勇;;我国公共档案馆APP开发现状及发展策略研究[J];信息资源管理学报;2017年02期
9 胡媛;毛宁;;基于用户画像的数字图书馆知识社区用户模型构建[J];图书馆理论与实践;2017年04期
10 王晓湘;;面向科研服务的高校和研究机构图书馆转型发展的战略地图[J];现代情报;2017年04期
【二级参考文献】
相关期刊论文 前10条
1 张晓林;;建立面向变化和可持续创新的发展管理机制[J];中国图书馆学报;2006年01期
2 胡燕菘;国内公共图书馆数字化建设项目综述[J];图书馆;2005年04期
3 王世伟;上海图书馆近年来拓展网络服务述略[J];图书馆学刊;2005年04期
4 张晓林;;从数字图书馆到E-Knowledge机制[J];中国图书馆学报;2005年04期
5 胡燕菘;国内数字图书馆研究项目综述[J];高校图书馆工作;2005年02期
6 束漫;广东数字图书馆建设的状况、问题与建议[J];图书馆论坛;2004年01期
7 兰小筠,张燕舞;我国数字图书馆研究论文(1994~2001年)定量分析[J];情报科学;2002年06期
8 莫少强;广东省数字图书馆建设和资源共享的研究与实践[J];图书馆论坛;2002年01期
9 张晓林;数字图书馆机制的范式演变及其挑战[J];中国图书馆学报;2001年06期
10 王世伟;数字图书馆——新世纪图书馆发展的重要机遇[J];河南图书馆学刊;2001年03期
【相似文献】
相关期刊论文 前10条
1 崔丽芬;;理想与实践——OA期刊的未来发展[J];现代情报;2013年03期
2 韩燕丽;;我国OA期刊资源平台研究[J];科技与出版;2013年11期
3 张红芹;黄水清;;OA期刊质量评价指标体系初探[J];情报杂志;2007年03期
4 欧阳雪梅;张苹;廖光珍;张小强;;OA知识库和OA期刊的对比分析[J];编辑学报;2007年04期
5 王国庆;OA期刊——学术出版领域的巨流[J];现代情报;2005年10期
6 潘琳;;OA期刊的来源、分布与质量分析研究[J];图书馆理论与实践;2007年01期
7 田质兵;;基于OA期刊的信息推送服务研究[J];情报探索;2010年08期
8 韩奋发;;OA期刊模式与大学学科馆员制度对接整合和创新发展[J];安康学院学报;2012年03期
9 马红;;比较OA期刊与OA知识库实现途径的差异分析[J];现代情报;2008年02期
10 马红;;基于OA期刊与OA知识库实现途径的比较分析[J];图书馆学研究;2008年02期
相关硕士学位论文 前2条
1 张迁;OA期刊站点资源抽取与存储方法[D];燕山大学;2014年
2 杜宝瑞;基于Hadoop的OA期刊论文资源发现及采集方法[D];燕山大学;2013年
,本文编号:1705470
本文链接:https://www.wllwen.com/tushudanganlunwen/1705470.html