基于知识图谱的图书馆电子资源自动去重方法研究
发布时间:2021-05-09 16:05
图书馆电子资源建设过程中需要统计相关数据,采用传统人工去重方法耗费时间较长,针对该问题,提出了基于知识图谱的图书馆电子资源自动去重方法研究。利用CiteSpace软件对文献中的关键词进行统计分析,提取所需信息,并将其存入资源库之中。通过格式化各字段基本信息说明,将其导入excel格式文件之中,实现图书馆电子资源抓取。依据抓取结果分析收录冗余和查全冗余资源,确定去重思路,以特定统一资源定位符为基准,匹配相关信息。格式统一处理,去除非关键信息,查询数位物件识别号,计算哈希值,将检索特征插入特征字典之中,以此设计图书馆电子资源自动去重流程。由实验结果可知,该方法去重时间较短,能够有效应用于图书馆信息获取与统计工作之中。
【文章来源】:电子设计工程. 2020,28(12)
【文章页数】:5 页
【文章目录】:
1 基于知识图谱图书馆电子资源抓取与整合
1.1 资源抓取
1.2 资源整合
2 跨库检索去重分析
2.1 抓取结果冗余分析
1)收录冗余
2)查全冗余
2.2 去重依据分析
3 图书馆电子资源自动去重流程设计
4 实验分析
4.1 实验环境
4.2 资源准备
4.3 去重时间对比分析
4.3.1 检索时间对比分析
4.3.2 去重时间对比分析
5 结束语
【参考文献】:
期刊论文
[1]高校图书馆电子资源专人负责制的实践探索——以山西大学图书馆为例[J]. 郭建宏. 图书馆学刊. 2019(03)
[2]基于大数据决策的图书馆信息系统安全分析与管理[J]. 杨琳,刘怡麟. 电子设计工程. 2018(22)
[3]基于语义的数字图书馆检索模型研究[J]. 马佳立. 电子设计工程. 2018(22)
[4]电子资源管理与评估——以上海财经大学图书馆的外文电子期刊为例[J]. 李娜. 图书情报工作. 2018(15)
[5]一种在去重备份系统中数据碎片整理算法[J]. 韩莹,单维峰,孙晓叶,郭娜,张翔. 科技通报. 2018(06)
[6]基于混合聚类算法的图书馆管理系统研究[J]. 周运丽. 计算机与数字工程. 2018(03)
[7]基于语言值聚合算法的数据去重产品选择[J]. 梁律. 控制工程. 2018(01)
[8]图书馆数字资源聚合质量预测模型构建——基于改进遗传算法和BP神经网络[J]. 闫晶,毕强,李洁,王福. 数据分析与知识发现. 2017(12)
[9]提高高校图书馆电子资源利用效率的途径分析[J]. 李永强. 现代交际. 2017(20)
[10]北京高科大学联盟图书馆电子资源联合采购的实践与探索[J]. 杨守文,王婷,张建文,高彦静. 情报探索. 2017(10)
本文编号:3177604
【文章来源】:电子设计工程. 2020,28(12)
【文章页数】:5 页
【文章目录】:
1 基于知识图谱图书馆电子资源抓取与整合
1.1 资源抓取
1.2 资源整合
2 跨库检索去重分析
2.1 抓取结果冗余分析
1)收录冗余
2)查全冗余
2.2 去重依据分析
3 图书馆电子资源自动去重流程设计
4 实验分析
4.1 实验环境
4.2 资源准备
4.3 去重时间对比分析
4.3.1 检索时间对比分析
4.3.2 去重时间对比分析
5 结束语
【参考文献】:
期刊论文
[1]高校图书馆电子资源专人负责制的实践探索——以山西大学图书馆为例[J]. 郭建宏. 图书馆学刊. 2019(03)
[2]基于大数据决策的图书馆信息系统安全分析与管理[J]. 杨琳,刘怡麟. 电子设计工程. 2018(22)
[3]基于语义的数字图书馆检索模型研究[J]. 马佳立. 电子设计工程. 2018(22)
[4]电子资源管理与评估——以上海财经大学图书馆的外文电子期刊为例[J]. 李娜. 图书情报工作. 2018(15)
[5]一种在去重备份系统中数据碎片整理算法[J]. 韩莹,单维峰,孙晓叶,郭娜,张翔. 科技通报. 2018(06)
[6]基于混合聚类算法的图书馆管理系统研究[J]. 周运丽. 计算机与数字工程. 2018(03)
[7]基于语言值聚合算法的数据去重产品选择[J]. 梁律. 控制工程. 2018(01)
[8]图书馆数字资源聚合质量预测模型构建——基于改进遗传算法和BP神经网络[J]. 闫晶,毕强,李洁,王福. 数据分析与知识发现. 2017(12)
[9]提高高校图书馆电子资源利用效率的途径分析[J]. 李永强. 现代交际. 2017(20)
[10]北京高科大学联盟图书馆电子资源联合采购的实践与探索[J]. 杨守文,王婷,张建文,高彦静. 情报探索. 2017(10)
本文编号:3177604
本文链接:https://www.wllwen.com/tushudanganlunwen/3177604.html