期刊论文元数据自动抽取系统的设计与实现
本文关键词:期刊论文元数据自动抽取系统的设计与实现
【摘要】:本文提出一种利用网页文本结构聚类从而抽取参考文献元数据的方法,并利用期刊论文的自有格式和同一网站结构相似的特征提取期刊论文的其余元数据。该方法首先将网页期刊论文进行文本块的划分,再利用正则表达式和文本结构的特性实现元数据的自动抽取。实验数据证明了该方法的有效性。
【作者单位】: 南京中医药大学经贸管理学院信息管理系;
【关键词】: 元数据 命名实体 信息抽取 正则表达式
【基金】:江苏省社会科学基金项目“网络舆情监控预警模式研究”(项目编号:10TQC008) 江苏省高校哲学社会科学研究基金项目“基于本体的高校突发事件网络舆情监控预警模式研究”(项目编号:2010SJB870003) 江苏省教育科学“十二五”规划2011年度课题“中国高等医药院校学术影响力研究”(项目编号:C-c/2011/01/81) 南京中医药大学医史文献学科建设基金项目“基于海量科技文献信息的中医学知识组织研究”(项目编号:WX2013-12) 江苏省教育厅“青蓝工程”资助(项目编号:苏教师(2014)23号)资助的研究成果之一
【分类号】:TP393.092
【正文快照】: 目前,利用引文分析法进行科学评价研究已经相当成熟,而且涌现出大批成果,但是一般研究机构难以开展引文数据加工工作,因而也就无法利用第一手数据进行相关研究工作。究其原因:一是引文数据量太大,人力、物力有限;二是引文标注格式不统一,对加工人员的素质要求较高。如何克服大
【相似文献】
中国期刊全文数据库 前10条
1 肖刚;;元数据在P2P网络下查询改进中的应用[J];计算机与数字工程;2012年04期
2 高妮;周明全;耿国华;贺毅岳;;网络科技资源平台中元数据的设计与实现[J];计算机工程与应用;2009年25期
3 周立军;邢红宏;张杰;;基于元数据的军械保障信息资源共享服务研究[J];计算机系统应用;2013年10期
4 李莲花,刘渊;基于元数据的网络资源管理系统的建设研究[J];信息技术;2002年11期
5 张萍;网络环境下的元数据研究[J];新疆石油教育学院学报;2005年01期
6 郭瑞华,张玉莉;语义Web上DC元数据的描述及抽取技术[J];现代情报;2005年06期
7 陈涛;肖侬;刘芳;;对象存储系统中自适应的元数据负载均衡机制[J];软件学报;2013年02期
8 尚佳;杨吉江;许有志;;基于XML的电子文件元数据捕获系统研究[J];计算机与数字工程;2011年10期
9 王卷乐;游松财;孙九林;;地学数据共享网络中的元数据扩展和互操作技术[J];兰州大学学报;2006年05期
10 张萍;OAI元数据获取协议[J];情报理论与实践;2003年06期
中国硕士学位论文全文数据库 前7条
1 许发见;元数据在教学网站中的应用研究[D];河海大学;2004年
2 袁俊超;G/S模式下分布式空间数据服务器群中的元数据组织与管理[D];成都理工大学;2010年
3 廖程锋;一种基于元数据的搜索引擎的设计与实现[D];中南大学;2004年
4 赵治军;OAI-PMH中元数据相似度计算的研究与实现[D];太原科技大学;2009年
5 李相娜;基于LDAP的元数据服务器集群的研究与实现[D];华中科技大学;2007年
6 张磊;基于P2P的信息共享Agent研究[D];浙江大学;2005年
7 王爱国;基于校园网的XML信息表示及数据挖掘研究[D];山东大学;2005年
,本文编号:541602
本文链接:https://www.wllwen.com/wenshubaike/xingzhengshiwu/541602.html