中文个人名称规范记录的实体匹配与聚簇
发布时间:2017-08-04 22:10
本文关键词:中文个人名称规范记录的实体匹配与聚簇
更多相关文章: 虚拟国际规范文档 个人名称规范档 实体匹配 聚簇
【摘要】:本文尝试解决国内个人名称规范联合数据库检索结果集基于实体匹配的聚簇问题,分析国内名称规范联合库CCCNA的检索服务和数据库记录特点,提出对结果集记录合并聚簇的思路:首先预处理去除重复和明显的名称语义不匹配记录,再根据提取出的个人实体属性名称、出生年、个人关联的书目题名及关联的外部记录,基于个人实体的语义进行个人名称规范记录聚簇。实证统计结果显示,处理后结果集内的簇数都显著低于处理前的记录条数,与VIAF的关联聚簇结果也验证了本文方法的有效性。但本文书目匹配采取题名匹配,这会丢失一些有用的聚簇信息,后续研究将进一步集成图书机构的书目数据库,抽取更多的书目信息进行聚簇。
【作者单位】: 山西大学经济与管理学院;
【关键词】: 虚拟国际规范文档 个人名称规范档 实体匹配 聚簇
【基金】:国家社科基金重点项目“基于关联数据的中文名称规范档语义描述及数据聚合研究”(项目编号:15ATQ004)的研究成果之一
【分类号】:G254.3
【正文快照】: 1引言 名称规范档根据控制规范规则,将名称信息按照统一的标目形式展现,为用户查询名称实体提供更高效的途径。由于单一机构构建的名称规范档规模较小,随着机构之间合作的深人,名称规范档资源之间的共建共享成为必然。2003年,国家图书馆(NLC)、中国高等教育文献保障系统管理中
【相似文献】
中国期刊全文数据库 前10条
1 汤蓉;唐常杰;徐开阔;左R,
本文编号:621964
本文链接:https://www.wllwen.com/tushudanganlunwen/621964.html
教材专著