当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于多Web信息源的主题概念网络获取

发布时间:2020-12-09 01:57
  Wikipedia一方面能够提供关于特定百科条目的概念性描述;另一方面,也通过分类系统将这些百科条目组织成一个概念网络.它对信息的广泛覆盖和有效组织使其成为了自动化知识获取的常用信息源.然而,仅仅依靠Wikipedia自身的信息,还不足以准确地刻画其内部概念间的关联性知识,而这是符号化知识表述的一个重要组成部分.因此,提出了一种基于多Web信息源的主题概念网络获取方法.它以Wikipedia的分类系统为基础,同时利用搜索引擎收集相关的Web信息作为关联性知识验证和发现的参照系,并通过集成信息检索和自然语言处理等领域的方法,实现了以给定的主题词为核心,在Wikipedia分类系统对应的概念网络中获取面向该主题的概念网络,同时网络内的概念间关系得到识别和标注.我们基于不同领域的主题词进行了实验,对实验结果的经验性评估展示了所获取的主题概念网络既能满足面向主题的要求,其内部的概念关联性知识又具备了一定的精度要求. 

【文章来源】:计算机研究与发展. 2013年09期 第1843-1854页 北大核心

【文章页数】:12 页


本文编号:2906051

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2906051.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户78ccc***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com