WordNet和《中国分类主题词表》的映射研究
发布时间:2021-10-31 14:06
随着网络的发展,信息数量激增但缺乏结构性,使得用户查找所需知识、系统呈现相关信息以及专家维护信息系统的难度都大大增加。基于此,通过建立本体并高效地实现本体的共享从而实现对信息、知识的共享和重用为越来越多的学者所关注并成为相关领域学者研究的热点。现实中,不同领域甚至同一领域中往往存在多个异构本体,能够运用于所有本体并真正实现本体共享的方法与系统并不多见。本体映射通过建立异构本体间的语义关系并输出概念、属性等映射对来实现本体间的重用和互操作。中文资源是全球知识与信息网络的重要组成部分,实现中文本体间以及中、外文表示的本体间的映射是实现本体共享、重用的一个重要方面。目前针对本体映射的研究有很多,但在众多的映射方法和系统中,对中文本体间以及对中、外文本体间进行映射处理的仍非常有限,而且有些映射系统在运行时并不考虑跨语言本体之间产生的语义上的歧义。本文致力于WordNet和《中国分类主题词表》的映射研究,旨在扩大《中国分类主题词表》的词汇量,从而为实现中文本体间的映射提供一个映射的标准与基础,使得中文本体间的映射更加准确并且更能体现中文的结构和特点。本文采用了中文WordNet和Web版的《中国...
【文章来源】:山西大学山西省
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
本体维度不同所导致的本体异构
也即信息的意义的不同。这样,即使两种形式化语言通过转化都正确地表示了实体的语义,也可能因为用户无法识别或者理解错误而导致不能理解本体构建者的意图。如图2.2所示:两个实体不存在句法层面、术语层面以及概念层面的异构,只是对不同本体构建者的等价的表现方式理解错误。丫x,b(x)劝a(x)丫x,c(x)幼a(x)丫x,d(x)斗c(x)丫x,。(x)斗e(x)图2.2两种相同意思的表现方式本体创建者对一个实体预订的用途对本体映射有很大的影响,我们不能仅仅因为两个实体在语义上是相关的就对它们进行映射。比如“欧洲”这个概念,在分类式多媒体库中它以路径“ Irnage/B&W/EuroPe”来表示
图2.3MareEhrig描述的本体映射过程黄烟波分为四个部分〔‘3」,笔者在联系其它文献的基础上归纳为以下几个部分:(l)范化:共享一般建立在同一种语言描述的知识上,这一步把待映射的本体用同一种语言表示,且应该使本体的表示规范化,解决句法层上的、结构层上的异构,这可以通过计算机的自动翻译功能或者使用标准的本体描述语言(比如OwL)来解决;(2)元素特征提取:为了计算相似度,需要提取诸如概念、属性名称等本体元素特征,并选择出用于映射的概念对;(3)概念之间语义相似度的计算以及整合:针对不同的领域本体,计算方法各有不同,用多种方法计算会得出多种相似度值,则需要综合考虑各个相似度值进行整合;(4)确定待匹配本体之间的映射关系:根据上面计算出的相似度,挑选必要的策略确定相应的映射关系;
【参考文献】:
期刊论文
[1]本体评估工具的比较分析[J]. 贾君枝,牛雅楠. 图书情报工作. 2010(06)
[2]一种基于Swoogle本体映射的改进算法[J]. 刘应龙,江杰. 计算机系统应用. 2009(07)
[3]《汉语主题词表》XML文档的自动生成研究[J]. 贾君枝,卫荣娟,罗林强. 现代图书情报技术. 2009(05)
[4]基于树结构的多策略本体映射算法[J]. 杨先娣,彭智勇,吴黎兵,刘君强. 武汉大学学报(理学版). 2008(03)
[5]FrameNet、WordNet、VerbNet比较研究[J]. 贾君枝,董刚. 情报科学. 2007(11)
[6]《汉语主题词表》转换为本体的思考[J]. 贾君枝. 中国图书馆学报. 2007(04)
[7]叙词表与Ontology的比较研究[J]. 岳巧云. 科技情报开发与经济. 2006(24)
[8]一个基于相似度计算的动态多维概念映射算法[J]. 程勇,黄河,邱莉榕,史忠植. 小型微型计算机系统. 2006(06)
[9]本体映射方法研究[J]. 黄烟波,张红宇,李建华,谭立球,李志. 计算机工程与应用. 2005(18)
[10]基于语义Web的本体映射方法综述[J]. 袁洋,李善平. 计算机科学. 2004(05)
本文编号:3468269
【文章来源】:山西大学山西省
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
本体维度不同所导致的本体异构
也即信息的意义的不同。这样,即使两种形式化语言通过转化都正确地表示了实体的语义,也可能因为用户无法识别或者理解错误而导致不能理解本体构建者的意图。如图2.2所示:两个实体不存在句法层面、术语层面以及概念层面的异构,只是对不同本体构建者的等价的表现方式理解错误。丫x,b(x)劝a(x)丫x,c(x)幼a(x)丫x,d(x)斗c(x)丫x,。(x)斗e(x)图2.2两种相同意思的表现方式本体创建者对一个实体预订的用途对本体映射有很大的影响,我们不能仅仅因为两个实体在语义上是相关的就对它们进行映射。比如“欧洲”这个概念,在分类式多媒体库中它以路径“ Irnage/B&W/EuroPe”来表示
图2.3MareEhrig描述的本体映射过程黄烟波分为四个部分〔‘3」,笔者在联系其它文献的基础上归纳为以下几个部分:(l)范化:共享一般建立在同一种语言描述的知识上,这一步把待映射的本体用同一种语言表示,且应该使本体的表示规范化,解决句法层上的、结构层上的异构,这可以通过计算机的自动翻译功能或者使用标准的本体描述语言(比如OwL)来解决;(2)元素特征提取:为了计算相似度,需要提取诸如概念、属性名称等本体元素特征,并选择出用于映射的概念对;(3)概念之间语义相似度的计算以及整合:针对不同的领域本体,计算方法各有不同,用多种方法计算会得出多种相似度值,则需要综合考虑各个相似度值进行整合;(4)确定待匹配本体之间的映射关系:根据上面计算出的相似度,挑选必要的策略确定相应的映射关系;
【参考文献】:
期刊论文
[1]本体评估工具的比较分析[J]. 贾君枝,牛雅楠. 图书情报工作. 2010(06)
[2]一种基于Swoogle本体映射的改进算法[J]. 刘应龙,江杰. 计算机系统应用. 2009(07)
[3]《汉语主题词表》XML文档的自动生成研究[J]. 贾君枝,卫荣娟,罗林强. 现代图书情报技术. 2009(05)
[4]基于树结构的多策略本体映射算法[J]. 杨先娣,彭智勇,吴黎兵,刘君强. 武汉大学学报(理学版). 2008(03)
[5]FrameNet、WordNet、VerbNet比较研究[J]. 贾君枝,董刚. 情报科学. 2007(11)
[6]《汉语主题词表》转换为本体的思考[J]. 贾君枝. 中国图书馆学报. 2007(04)
[7]叙词表与Ontology的比较研究[J]. 岳巧云. 科技情报开发与经济. 2006(24)
[8]一个基于相似度计算的动态多维概念映射算法[J]. 程勇,黄河,邱莉榕,史忠植. 小型微型计算机系统. 2006(06)
[9]本体映射方法研究[J]. 黄烟波,张红宇,李建华,谭立球,李志. 计算机工程与应用. 2005(18)
[10]基于语义Web的本体映射方法综述[J]. 袁洋,李善平. 计算机科学. 2004(05)
本文编号:3468269
本文链接:https://www.wllwen.com/tushudanganlunwen/3468269.html