基于多材料本体的语义查询扩展机制的研究
发布时间:2019-09-30 10:44
【摘要】:随着材料信息学的不断发展,出现越来越多的金属材料数据源,在这些数据源中包含着大量的金属材料知识和丰富的结构。然而,这些材料数据源中的存储结构和命名方式都存在一定的差异,使用传统的关键字查询方法在这些数据源中进行查询,其效果不是非常理想。为了提高其检索性能,本文提出了一种基于多材料本体的语义查询扩展方法,即需要对用户输入的种子查询概念在多个材料本体中进行语义扩展,然后在材料数据源中进行查询,使其查询结果中能够包含更多更加准确的相关结果。本课题所做的主要研究工作如下:1)基于多材料本体的概念扩展。首先,根据多个材料本体提出了一种相似性概念扩展策略S-SMOA,该策略采用基于字符串的SMOA算法以及材料本体的上下位结构在多个材料本体中对用户输入的种子查询概念进行相似性概念扩展。然后,利用基于集合的Jaccard算法设计出一种相关概念扩展策略P-Jaccard,该策略利用材料本体中的对象属性以及Jaccard算法获取相关概念。2)扩展概念的过滤和补充。首先,为了提高概念扩展的准确率,提出了一种基于Leacock-Chodorow算法的概念过滤策略,对扩展概念集合中的概念进行过滤。其次,为了保证其概念扩展的召回率和完整性,需要对扩展过滤后的概念进行一次概念补充,利用基于结构的Leacock-Chodorow算法对种子查询概念进行扩展,将扩展后的概念与过滤后的概念进行合并补充,保证概念扩展的完整性。3)扩展概念在数据源中的查询处理。首先,利用基于字符串算法SMOA的匹配策略,对扩展概念在数据源中进行概念定位,得到匹配概念集合。然后设计出了一种基于多本体的语义查询处理方案,该方案根据RDF数据的三元组结构的特点以及用户所选的不同的查询模式动态的生成SPARQL语句,并在数据源中进行查询,其查询结果可以以文本和可视化两种方式展示给材料数据用户。基于多材料本体的语义查询扩展机制,不仅使用SMOA和Jaccard算法进行概念扩展,还充分利用了材料本体的上下位结构以及本体中概念的属性,扩展到更多相关概念。同时还使用了Leacock-Chodorow方法对扩展概念进行过滤和补充,提高了概念扩展的准确性和完整性。为材料领域用户和专家提供了一种语义查询扩展方法,并提供了一个基于多材料本体的语义查询扩展系统。
【图文】:
19]。图2-1 查询扩展理解图对查询扩展的理解可以通过金属材料实例铝合金作为种子查询概念进行举例,如图2-1所示,可以看出如果不进行概念扩展,则其查询结果只包含铸造铝合金和锻造铝合金等等,但是如果对铝合金进行概念扩展之后再进行查询,则其查询结果不仅包含铸造铝合金和锻造铝合金,同时还包含铝合金的实例概念(ZL104等)以及相对应的属性等等。查询扩展包含如下技术[20]:1)查找种子查询概念的同义词,将得到的这些同义词再次进行查找;2)查找词汇的各种形态,通过在搜索查询中提取单词词干;3)修改拼写错误,并且自动进行搜索对于修改过的形式或在结果中给予暗示标识;4)重新调整在原始查询中的术语权重值。2.2 基于本体的查询扩展方法目前
所以本章主要介绍基于多材料本体的概念扩展部分。具体的相关概念定义如下:定义1:扩展本体。扩展本体用于对于原始种子查询概念进行扩展,,本文所使用的扩展本体为STSM、MMOY和AMO三个本体。扩展本体可以表示为一个六元组,即ES = (Cc, Cr, Ic, Ir, Pc, Pr),其中Cc表示核心概念集合,Cr表示相关概念集合,Ic表示核心实例概念集合,Ir表示相关实例集合,Pc表示核心属性集合,Pr表示相关属性集合。定义2:查询模式。查询模式构成了用户的查询模板,不同的查询模式可以查询不同方面的信息内容,用户可以根据自己的需求选择相应的查询模式。定义3:相似性概念扩展。相似性概念扩展是指采用相应的扩展策略对种子查询概念在扩展本体中进行相似性扩展,可以得到与种子查询概念含义相似或相近的一些概念。定义4:相关性概念扩展。相关性概念扩展是根据种子查询概念本身及其相似的概念所推荐出来的概念,与用户所选的查询模式紧密相关,选择不同的查询模式则会推荐出不同的相关概念。
【学位授予单位】:河北科技大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TG14;TP391.1
本文编号:2544250
【图文】:
19]。图2-1 查询扩展理解图对查询扩展的理解可以通过金属材料实例铝合金作为种子查询概念进行举例,如图2-1所示,可以看出如果不进行概念扩展,则其查询结果只包含铸造铝合金和锻造铝合金等等,但是如果对铝合金进行概念扩展之后再进行查询,则其查询结果不仅包含铸造铝合金和锻造铝合金,同时还包含铝合金的实例概念(ZL104等)以及相对应的属性等等。查询扩展包含如下技术[20]:1)查找种子查询概念的同义词,将得到的这些同义词再次进行查找;2)查找词汇的各种形态,通过在搜索查询中提取单词词干;3)修改拼写错误,并且自动进行搜索对于修改过的形式或在结果中给予暗示标识;4)重新调整在原始查询中的术语权重值。2.2 基于本体的查询扩展方法目前
所以本章主要介绍基于多材料本体的概念扩展部分。具体的相关概念定义如下:定义1:扩展本体。扩展本体用于对于原始种子查询概念进行扩展,,本文所使用的扩展本体为STSM、MMOY和AMO三个本体。扩展本体可以表示为一个六元组,即ES = (Cc, Cr, Ic, Ir, Pc, Pr),其中Cc表示核心概念集合,Cr表示相关概念集合,Ic表示核心实例概念集合,Ir表示相关实例集合,Pc表示核心属性集合,Pr表示相关属性集合。定义2:查询模式。查询模式构成了用户的查询模板,不同的查询模式可以查询不同方面的信息内容,用户可以根据自己的需求选择相应的查询模式。定义3:相似性概念扩展。相似性概念扩展是指采用相应的扩展策略对种子查询概念在扩展本体中进行相似性扩展,可以得到与种子查询概念含义相似或相近的一些概念。定义4:相关性概念扩展。相关性概念扩展是根据种子查询概念本身及其相似的概念所推荐出来的概念,与用户所选的查询模式紧密相关,选择不同的查询模式则会推荐出不同的相关概念。
【学位授予单位】:河北科技大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TG14;TP391.1
【参考文献】
相关期刊论文 前4条
1 李华昱;张培颖;肖晗;;基于抽取规则和本体映射的领域XML语义集成[J];河北科技大学学报;2016年04期
2 韩仙玉;闫东亮;李睿;;一种针对特定领域的查询扩展方法[J];计算机应用与软件;2014年01期
3 贺元香;史宝明;张永;;基于本体的语义相似度算法研究[J];计算机应用与软件;2013年11期
4 张娟;高克峰;张曦;;从文本中学习本体的系统设计[J];河北工业科技;2011年03期
本文编号:2544250
本文链接:https://www.wllwen.com/kejilunwen/jinshugongy/2544250.html
教材专著