网络环境中知识脉络分析服务的研究与实现
发布时间:2014-09-20 08:39
摘要:本文提出了在知识网络分析的基础上增加时序分析的维度,形成知识脉络 分析的观点。并介绍了如何运用共词网络、引文网络等分析方法,实现知 识脉络分析服务的方法。最后简要总结了笔者在研究构建万方数据知识服 务平台知识脉络分析服务工作中的实践。
关键词: 知识网络 知识脉络 引文网络 共词网络 时序分析
1 引言
在当前关于知识的多种定义中,《现代汉语词典》中对知识的定义是一种 普遍可以接受的观点,它将知识定义为是人类在改造世界的实践中所获得的认 识和经验的总和。人类认识和改造世界的过程中形成了各种知识,这些知识内 容之间存在着内在逻辑关系。特定知识内容形成知识节点,若干知识节点内在 的逻辑关联便构成的网络化的知识体系,形成了知识网络[1]。除此之外,国内 外从事知识管理的学者从知识管理的角度,将知识网络定义为一批人、资源以 及他们之间关系,为了知识创造、知识转移,促进知识的利用。因此知识网络 的内涵和种类也很多。有学者将知识网络分为大致四类:
1)知识主体间的网络:其实质是知识在不同主体间流动或传播的网络。
2)知识与知识之间的网络:以知识为结点,以知识分类或语义分类为基础 建立的知识与知识之间的关联网络。
3)知识存储媒介之间的网络:主要指由文档分类、索引等形成的知识网 络。
4)多种类型的节点或关系构成的知识网络:研究较多的是知识与人之间的 网络。网络的构成要素涉及人、资源和关系等。[2]
本文所指的知识网络以及知识脉络的概念主要针对知识点直接的内在逻辑 关系,是众多知识网络中的一种。即上述知识网络分类中的第二种。
在这种知识网络中,某个知识点作为一个知识网络节点,和其他相关知识 点之间形成网络关系,节点与节点之间的距离代表知识点之间关联的紧密程 度。在这样的知识网络中,从任意知识节点出发,都能找到和其临近的其他知 识点。因为任何知识点都不可能是孤立的,甚至从任一知识点出发,都能遍历 整个知识网络。但是这样的知识网络也存在一个问题,因为随着时间的发展, 人类认知会进步,知识也会发展。因此不同年度的知识网络应该具有不同的形 状。
基于这样的认识,本文在知识网络的基础上增加了时序分析的维度,提出 了知识脉络的概念。即为某一知识点在不同年代画出一张知识网络图,不同年
关键词: 知识网络 知识脉络 引文网络 共词网络 时序分析
1 引言
在当前关于知识的多种定义中,《现代汉语词典》中对知识的定义是一种 普遍可以接受的观点,它将知识定义为是人类在改造世界的实践中所获得的认 识和经验的总和。人类认识和改造世界的过程中形成了各种知识,这些知识内 容之间存在着内在逻辑关系。特定知识内容形成知识节点,若干知识节点内在 的逻辑关联便构成的网络化的知识体系,形成了知识网络[1]。除此之外,国内 外从事知识管理的学者从知识管理的角度,将知识网络定义为一批人、资源以 及他们之间关系,为了知识创造、知识转移,促进知识的利用。因此知识网络 的内涵和种类也很多。有学者将知识网络分为大致四类:
1)知识主体间的网络:其实质是知识在不同主体间流动或传播的网络。
2)知识与知识之间的网络:以知识为结点,以知识分类或语义分类为基础 建立的知识与知识之间的关联网络。
3)知识存储媒介之间的网络:主要指由文档分类、索引等形成的知识网 络。
4)多种类型的节点或关系构成的知识网络:研究较多的是知识与人之间的 网络。网络的构成要素涉及人、资源和关系等。[2]
本文所指的知识网络以及知识脉络的概念主要针对知识点直接的内在逻辑 关系,是众多知识网络中的一种。即上述知识网络分类中的第二种。
在这种知识网络中,某个知识点作为一个知识网络节点,和其他相关知识 点之间形成网络关系,节点与节点之间的距离代表知识点之间关联的紧密程 度。在这样的知识网络中,从任意知识节点出发,都能找到和其临近的其他知 识点。因为任何知识点都不可能是孤立的,甚至从任一知识点出发,都能遍历 整个知识网络。但是这样的知识网络也存在一个问题,因为随着时间的发展, 人类认知会进步,知识也会发展。因此不同年度的知识网络应该具有不同的形 状。
基于这样的认识,本文在知识网络的基础上增加了时序分析的维度,提出 了知识脉络的概念。即为某一知识点在不同年代画出一张知识网络图,不同年
代的网络图按顺序链接起来,形成某一知识点在不同年代的知识网络形状演变 脉络图,简称为知识脉络。
2 知识脉络分析实例
知识脉络在知识网络的基础上增加时序分析后,可以更为直观地看出知识 点之间随着时间的发展变化,如下面几幅图是根据万方数据知识服务平台所收 录文献资源分析的2004年、2007年、2009年三个年度“数字图书馆”知识点相 邻知识点的分析。
图 1 2004 年“数字图书馆”知识点的相邻知识网络节点
图 2 2007 年“数字图书馆”知识点相邻的知识网络节点
图 3 2009年 “数字图书馆”知识点相邻的知识网络节点
从以上几幅图中可以明显地看出,随着年度的变化,与“数字图书馆” 知识点相邻知识点的变化情况。比如在2004年度中,与“数据图书馆”知识点 按紧密程度从大到小依次相邻的知识点分别是:传统图书馆、元数据、信息资 源、知识产权、信息服务等。表明该年度相关研究的热点还聚焦在“数字图书 馆和传统图书馆的差异”、“使用什么元数据方案构建数字图书馆”、“数字 图书馆中信息资源的建设方案”、“数字图书馆信息资源的知识产权问题”以 及“数字图书馆中信息服务的建设”等方面。但到了2007年和2009年,与“数 字图书馆”依次相邻的知识点发生了变化,信息服务逐渐成了研究热点。这样
2 知识脉络分析实例
知识脉络在知识网络的基础上增加时序分析后,可以更为直观地看出知识 点之间随着时间的发展变化,如下面几幅图是根据万方数据知识服务平台所收 录文献资源分析的2004年、2007年、2009年三个年度“数字图书馆”知识点相 邻知识点的分析。
图 1 2004 年“数字图书馆”知识点的相邻知识网络节点
图 2 2007 年“数字图书馆”知识点相邻的知识网络节点
图 3 2009年 “数字图书馆”知识点相邻的知识网络节点
从以上几幅图中可以明显地看出,随着年度的变化,与“数字图书馆” 知识点相邻知识点的变化情况。比如在2004年度中,与“数据图书馆”知识点 按紧密程度从大到小依次相邻的知识点分别是:传统图书馆、元数据、信息资 源、知识产权、信息服务等。表明该年度相关研究的热点还聚焦在“数字图书 馆和传统图书馆的差异”、“使用什么元数据方案构建数字图书馆”、“数字 图书馆中信息资源的建设方案”、“数字图书馆信息资源的知识产权问题”以 及“数字图书馆中信息服务的建设”等方面。但到了2007年和2009年,与“数 字图书馆”依次相邻的知识点发生了变化,信息服务逐渐成了研究热点。这样
的变化,反应了不同年度研究热点和知识网络的变化情况,也反应了知识脉络 的时序发展情况。根据这些变化,我们画出“数字图书馆”知识点的知识脉络 图如下:
图 4 “数字图书馆 ” 知识点知识脉络图
其中上方的曲线表明该知识点在不同年度的研究热点的趋势变化,年度下 方的关键词表明在对应年度和该知识点最相关的知识点。从上而下的顺序代表 相关的程度从大到小的顺序。
3 研究分析 知识脉络的意义
知识脉络从某个知识点出发,结合时间维度形成的脉络分析,对学术选 题、学术研究等方面均有一定参考意义。
1)知识脉络从时间维度揭示了知识点的关注度,有助于学者了解学科发展 规律和研究选题。
2)知识脉络基于时序揭示了知识点之间随时间变化的演化关系,有助于发 现知识点之间的交叉、融合的演变关系,有助于学者发现新的研究方向、研究 趋势和研究热点。
4 知识脉络的 构建 方法
文献是知识的载体,是知识网络的构建重要基础素材。基于文献构建知识 网络的方法许多文献已经有所介绍[3][4][5],基于这些方法发展构建知识脉络 的几种可行方法如下:
1)共词网络分析法: 由文章关键词及其共现关系形成的网络称为“共词网络”[3]。每篇文献的
关键词形成一组共现,一个关键词作为一个知识点,存在共现关系的关键词作 为相关知识点。每共现一次,相应的关系权重对应增加。如此构建形成知识网
络。然后根据时间维度拆分,即可形成知识脉络。
2)引文网络分析法:
图 4 “数字图书馆 ” 知识点知识脉络图
其中上方的曲线表明该知识点在不同年度的研究热点的趋势变化,年度下 方的关键词表明在对应年度和该知识点最相关的知识点。从上而下的顺序代表 相关的程度从大到小的顺序。
3 研究分析 知识脉络的意义
知识脉络从某个知识点出发,结合时间维度形成的脉络分析,对学术选 题、学术研究等方面均有一定参考意义。
1)知识脉络从时间维度揭示了知识点的关注度,有助于学者了解学科发展 规律和研究选题。
2)知识脉络基于时序揭示了知识点之间随时间变化的演化关系,有助于发 现知识点之间的交叉、融合的演变关系,有助于学者发现新的研究方向、研究 趋势和研究热点。
4 知识脉络的 构建 方法
文献是知识的载体,是知识网络的构建重要基础素材。基于文献构建知识 网络的方法许多文献已经有所介绍[3][4][5],基于这些方法发展构建知识脉络 的几种可行方法如下:
1)共词网络分析法: 由文章关键词及其共现关系形成的网络称为“共词网络”[3]。每篇文献的
关键词形成一组共现,一个关键词作为一个知识点,存在共现关系的关键词作 为相关知识点。每共现一次,相应的关系权重对应增加。如此构建形成知识网
络。然后根据时间维度拆分,即可形成知识脉络。
2)引文网络分析法:
引文网络即文献之间的引用关系形成的网络关系。通过分析一篇文章的相 关的知识点,并将这些知识点映射到引文网络中。通过合并相同知识点整理形 成知识网络。然后增加文献发表时间,进而形成知识脉络。
5 知识脉络分析服务建设实践
基于以上研究,笔者在万方数据知识服务平台产品中实现了知识脉络分析 服务。该系统基于万方数据知识服务平台收录的海量文献资源,通过基于共词 网络和引文网络的分析方法,对知识脉络服务进行了完整实现,服务地址为 http://trend.wanfangdata.com.cn。无论是共词网络还是引文网络分析法,在 服务建设过程中遇到的一个困难是知识网络和知识脉络中的知识点节点数量巨 大,因此形成的网络关系维度巨大,需要构建良好数据结构和高性能的算法才 能支持知识脉络的构建过程并满足实际服务过程中的性能要求。笔者通过利用 相对高性能的数据结构和算法的应用,较好解决了这个问题。截止目前该服务 测试版已经上线一年左右,当前日访问量近十万次,取得较好运营效果。当前 也正在根据用户反馈和运营情况,进行再次设计研发,争取早日上线产品正式 版。
参考文献
[1] 赵蓉英.知识网络研究(Ⅱ)—知识网络的概念、内涵和特征.情报学报.2007,26(3):470-476
[2] 席运江,党延忠,廖开际.组织知识系统的知识超网络模型及应用.管理科学学报,2009,12(3):12-21
[3] 王晓光.科学知识网络的形成与演化(Ⅰ):共词网络方法的提出.情报学报.2009,28(4):599-605
[4] 李丹,俞竹超,樊治平.知识网络的构建过程分析,科学学研究,2002,20(6):620-623
[5] 彭锦.知识网络架构研究与原型系统设计[D].杭州:浙江大学,2005
本文编号:9084
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/9084.html