基于本体的信息检索技术的研究及其在教学平台中的应用
1绪论
为了提升教学平台中资源检索效果,使查全率和查准率都能达到一个较好的效果,本文研究了基于本体的语义检索技术并将其应用到教学平台的资源检索模块。最开始,本体是哲学领域的术语,随着人工智能技术的发展,就逐渐被计算机领域引入和应用,主要用于解决知识共享的问题。如果本体应用在某个领域,首先需要将该领域中被广泛接受和认可的词汇抽取出来,并且要抽象出送些词汇之间的联系,然后需要将抽取出的词汇以及词汇间的联系用形式化的语言进行描述。这样的本体被应用在某个具体领域内,因此称为领域本体,它能够支持该领域知识共享的实现。本文研究的目的是实现学习资源语义层面的检索,而不仅仅是停留在关键词匹配上,从而能够为用户提供更好的服务,提高资源检索的查全率和查准率,并且能够促进教学平台的进一步发展,使其可适应快速发展变化的学科。此外,由于目前大部分网络教学平台在建设教学资源库时没有统一的标准,这就导致了许多的问题,其中比较突出的问题是学习资源可重用性较差,不能在教学平台之间进行迁移。为了解决这个问题,本文在对学习资源进行描述时,采用了IMS学习资源元数据的标准,该标准已经接受并正式成为学习对象元数据模型。
..........
2信息检索及本体相关技术介绍
2.1信息检索概述
众所周知,如果要对某一类事物进行分类,则需要确定一个分类标准。同样地,对信息检索进行分类也需要确定一个分类标准,分类标准不同,分类结果的也不同。根据检索对象进行分类,可以分为数据、事实以及文献信息检索;组织方式进行分类,可分为全文检索、超文本检索从及超媒体检索;还可以按检索设备进行分类,可分为手工检索和机器检索。当然还有其他的分类方法,比如按机器检索的处理方式不同进行分类,可以分为脱机检索和联机检索;按存储方式进行分类,可以分为光盘检索、联机检索和网络检索等。经过分析,我们可以看到,从本质上来讲,以上提到的检索方法都是基于关键字或关键词的机械匹配来返回结果。我们可以把他们归为"关键词检索"的范畴。这种检索方式的优点是相对来说检索结果比较准确,但是弊端也是显而易见的.2.2检索系统的评价
一个理想的、完美的信息检索系统,在用户输入检索请求之后,返回的检索结果应该是完全符合用户需求的,既没有多余信息,也没有漏检信息。但是目前要想实现这样一个检索系统还是存在许多困难的。对于不同的检索系统,比如网络教学平台中的学习资源检索系统和一些企业当中的检索系统,它们的检索效果是不同的;即使是相同的检索系统,那么它们的检索效果也不同,比如即使都是网络教学平台的学习资源检索系统,,如果它们采取的检索技术和策略不同,那么其检索效果就会有很大的差异。那么,如何对一个检索系统做出客观公正的评价呢?这就需要一个评价标准,并且它一定要能反映拾索系统最重要的方面。而且在使用这个标准对系统进行评价的同时,也可为改善系统性能提供明确的参考依据。3语义扩展及语义相似度............21
3.1直接扩展........213.2推理扩展.........21
3.3语义相似度的概念.......24
3.4语义相似度的计算..........24
4中文分词及语义检索框架......28
4.1中文分词相关技术的介绍.......28
4.2学习资源元数据模型及其存储.......30
4.3语义检索框架的设计.......32
4.4本章小结........34
5原型系统的设计与实现.........35
5.1需求分析......35
5.2开发环境和工具....36
5.3本体的构建.......37
5原型系统的设计与实现
5.1需求分析
伴随着互联网技术的飞速发展,网络学习与远程教学己经成为一种非常重要且流行的学习方式,在这种学习方式的发展过程中,网络教学平台一直扮演着非常重要的角色,它在推动远程教育方面起到了重要的作用。目前,各种各样的教学平台层出不穷,但是他们都存在两个共同的问题:一是学习资源的重复建设;另一个是学习资源检索不能达到用户满意的效果。这两个问题也成为了阻碍网络教学平台进一步发展的瓶颈。目前网络教学平台上学习资源的数量越来越大,种类越来越多,但是对于不同的教学平台,这些学习资源并没有一个统一的组织方式,导致的结果就是不同的教学平台所构建的学习资源不能相互共享,造成学习资源的重复建设和资源的浪费。因此,为了解决这一问题,本文采用了第四章介绍的学习对象元数据模型LOM来对学习资源进行统一的、用户可以理解的描述。这也是本文研究内容的重要组成部分之一.
5.2开发环境和工具
第二章已经介绍了本体以及本体构建的理论知识,本节将在第二章理论知识基础之上,根据第二章介绍的本体构建步骤,具体介绍领域本体的构建过程。首先要界定本体的研究领域,因为本文的研究是基于思源网络教学平台,主要研究的是某一门课程的学习资源的语义检索,因此本文将把教材《数据结构与算法分析》作为本体研究领域。另一方面,由于本文构建的本体相对来说比较具体,因此并没有找到合适的可以进行复用的本体,所以在本体构建的过程中将跳过复用本体这一步骤。下面将介绍本体构建过程中比较重要的步骤,即列出本体中的核也概念和概念之间的属性和属性值。.......
6结论与展望
本文虽然做了一定的研究和开发工作,但是有一些想法目前还没有实现。根据本文当前的研究情况,笔者觉得还可以将以下几个方面的内容作为今后的研究方向。(1)学习资源的批量导入。本文在构建学习资源库的时候,是通过将收集到的学习资源逐个上传至系统中的,这样做的效率比较低,花费的时间较多。究其原因,主要是因为需要人工去对资源进行语义标注,如果系统能够自动对文档进行语义标注,那么将会节省大量的时间,也将使系统的性能得到进一步的提升。(2)本体的自动化构建。本文研究的领域本体规模较小,对其的维护和更新相对来说比较简单。但是当研究的领域变大时,如何更好的去维护本体就成为了一个问题。另外,构建本体还需要类似这样的软件,如果在系统中为管理员提供相应的本体管理的接口,那么管理员将不再需要通过专业软件去维护和构建本体了,这样对于提高系统的易用性也是很好的帮助。(3)进一步完善和改进系统的性能并投入使用。本文实现的原型系统只是实现了最主要的功能,然后系统在健壮性上并没有经过测试,以及直接与用户相关的界面方面和人性化方面还需要进一步的研究。
......
参考文献(略)
本文编号:66785
本文链接:https://www.wllwen.com/wenshubaike/lwfw/66785.html