面向大规模本体对齐的SAMBO系统的优化方法设计与实现
发布时间:2020-02-08 23:47
【摘要】:如今的万维网为人们提供了一种方便快速的获取信息的途径,但是万维网并不能够处理语义。换言之,人们可以从众多网页上有效地获取访问数据,但是计算机程序却不能够满足安全有效的数据复用与共享。因此,万维网的创始人Tim Berners-Lee提出了语义网络的概念。语义网络的初衷是在现有万维网的基础上添加新的表达语义的结构。这种知识描述结构经历了从可拓展标记语言XML,到资源描述框架RDF,再到本体论的阶段。越来越多的研究人员利用本体来表达特定领域的概念,关系以及相关语义。然而,不同的研究人员可能对于知识有着不同的理解,在建立本体的过程中就带来了相关,相似本体之间的不一致信息。例如,一些人会将细胞活化(cell activation)定义为T细胞活化(T-cell activation)和B细胞活化(B-cell activation)。与此同时,其他人可能将其定义为“T Cell Activation”和“B Cell Activation”。这种概念的不一致性不利于数据集成。因此,人们提出了本体对齐的概念以解决这一问题。SAMBO本体对齐系统由林雪平大学ADIT实验室在2005年设计实现。在它实现的最初几阶段。SAMBO系统可以解决大多数本体的对齐问题。但是,随着本体规模的日益扩大,SAMBO不再能满足大规模本体的对齐问题。本篇论文的主要内容就是优化SAMBO系统已实现大规模本体的对齐工作。本论文主要包含以下内容:首先,我们分析了如今表现优异的本体对齐系统AML和Log Map,这两个系统具有处理大规模本体的能力,我们分析以得出他们在处理大规模本体上的设计特点。它们的优点主要体现在数据结构的设计上支持索引功能。随后,我们分析了现有SAMBO系统旨在发现系统有哪些功能需要优化,经过分析得出了系统在数据结构,数据库设计,并行化匹配等方面存在优化需求。接下来,我们给出了优化方法的设计方案以及具体实现,主要包括设计新的数据结构已支持索引功能,重新设计数据库存储模式以满足大规模本体对齐数据的存储,优化完善并行化匹配的算法以及对系统业务逻辑的一些优化,缺陷消除等。最后,我们利用大规模本体测试评估了新的SAMBO系统并且获得了预期的结果。
【图文】:
本体描述文件格式[14]
本体对齐场景[15]
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.1
本文编号:2577644
【图文】:
本体描述文件格式[14]
本体对齐场景[15]
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.1
【相似文献】
相关硕士学位论文 前3条
1 李环宇;面向大规模本体对齐的SAMBO系统的优化方法设计与实现[D];哈尔滨工业大学;2016年
2 梅yN;基于本体的疾病关联搜索方法的设计与实现[D];哈尔滨工业大学;2017年
3 江东宇;基于本体的需求驱动的软件体系结构设计研究[D];南京航空航天大学;2017年
,本文编号:2577644
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2577644.html