当前位置:主页 > 社科论文 > 图书档案论文 >

数字图书馆数字资源中事实知识元识别与标引

发布时间:2024-04-14 16:44
  数字图书馆作为一种以网络技术为环境基础的知识网络系统,是重要的知识来源。为了满足用户精细化信息需求,数字图书馆数字资源的知识管理单位进一步细化到知识元。以事实知识元为研究对象,在对数字图书馆的数字资源管理现状及知识元的研究现状进行综述后,提出事实知识元的定义,针对事实知识元的特点,建立起事实知识元描述模型及抽取规则,以该抽取规则为基础,对事实知识元的抽取流程进行梳理,提出事实知识元描述框架。

【文章页数】:5 页

【部分图文】:

图1事实知识元描述规则构建流程

图1事实知识元描述规则构建流程

依据CSSCI核心期刊排名情况,选取若干情报学核心期刊,并从万方、维普、中国知网等数据库下载题录信息,对题录信息进行整合去重等处理后,整理出一份关键词表,然后从该表中获取事实描述术语,构建其术语表。根据该描述术语表对情报学某核心杂志某年的全文进行识别,得出所有关于事实描述的句子,....


图2知识元抽取流程

图2知识元抽取流程

知识元提取第一步,对实体资源进行预处理,即删减资源中与主题无关的信息,减少数据量,减轻后续数据组织处理的工作量,提高整体效率。在此过程中,应考虑实体资源存在形式,若为非文本形式,如图像、音频、视频等,应转化为文本形式再进行文本信息读取及后续处理;若实体资源本身为文本形式,即可直接....



本文编号:3954984

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/3954984.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户187a4***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com