基于领域本体的语义扩展检索算法的研究与应用

发布时间:2020-08-21 06:41
【摘要】:I随着信息爆炸时代的来临,根据关键字进行搜索的查询技术无法满足用户快速获取信息和知识的需求。而信息化技术的深入发展与应用使得利用语义和知识进行信息搜索成为一种可能和必需。本体学习和本体技术可以挖掘文本信息中隐含的知识并对其进行加工和重用,面对结构各异、大量的文本数据,梳理领域知识规律并设计抽取算法,是困难的但是极具意义。在信息检索中融入知识和语义,让计算机具有一定语义理解能力和领域知识,可以更好地提高检索效率和用户满意度。本文提出一个基于人工智能算法的领域本体学习方法以及在此基础上的语义检索框架,并对这一框架的设计实施以及相关算法的智能化和创新性问题进行了讨论和研究。在阅读大量相关文献的基础以及领域专家参与下,总结出不同的领域知识在其文献载体中的表现方式不一样的规律,根据酶的领域知识特性,寻找易于实现合乎规律高效的方法。通过反复实践探索如何运用知识在信息检索中充分表达检索意图来提高信息检索效率和满意度。本文首先提出一种基于统计学的本体学习方法。通过与综合语料库的对比来定义领域术语的相关性。然后根据酶的领域知识特性,总结出某一种酶的领域知识存在于一定范围的相关领域语料中,而在整个领域语料库中均匀出现的术语是领域术语的谓词关系,从而提出领域确定性的定义。通过将两者结合来抽取领域术语,然后再抽取该术语的关系,并对提取结果进行语义过滤,提高本体学习的正确性,改善领域本体的构建效率。再运用人工蜂群算法对领域语料文本空间搜索来获得术语及关系。为避免跟随蜂选择较优蜜源的方式过于贪婪,使算法多样性不足,在跟随蜂和引领蜂的搜索中加入方向性搜索信息,设计均匀选择算子,通过与多目标优化问题适应度的配合,扩大搜索区域,避免陷入局部最优,使算法具有导向性。在构建的领域本体的基础上,探讨并初步实现了一个基于语义扩展的全文检索框架,将语义与全文检索有机结合起来,本体学习,构建领域本体,利用语义进行全文检索,并对结果进行评价,将该结果反馈于本体学习以及蜂群算法的参数设置中,形成一个高效的智能检索框架。最后对该智能语义检索框架的各部分,本体学习,检索效率以及性能进行测试和分析。本文创新性在于:总结领域语料库中酶学领域知识中术语中心词的概念在整个领域语料中只存在较少文本中,而领域知识中普遍存在的通用关系在语料库中是均匀分布的。根据领域知识规律设计领域确定度作为抽取的标准,并加入权重和阈值;运用蜂群算法在语料抽取概念的过程中指定侦查蜂的初始行为并加入均匀选择算子,加快迭代速度,保证解的多样性;在全文搜索中,将文本中含有的本体元素计算权重作为检索排序的一个重要标准,提出语义相关度的计算方法对语义扩展进行规范度量,从而使得到结果更接近用户的检索意图。本研究的意义在于将智能语义检索框架进行了应用,使信息检索系统具有一定的学习能力,并将学习所得的相关领域术语概念及关系,进行层次化的结构规范,以构建对领域知识的理解;又能在搜索信息时,利用构建的领域本体获得知识,将语义用于检索。最后通过评价检索效果,再对本体学习及蜂群算法的相关参数进行调整,改善学习和检索能力。
【学位授予单位】:山东师范大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:TP391.3


本文编号:2799056

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/2799056.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c4231***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com