基于关系形式概念的教育资源语义模型研究
发布时间:2020-08-14 12:16
【摘要】:近年来,随着国家信息化战略的深入推进以及数字化教育的持续发展,我国各级教育资源建设已经取得了巨大的成就。Web上各类教育资源的存量巨大、内容丰富、增长迅速,特别是随着“互联网+”思维在社会生活中的深入应用实践,众多辅助的学习模式和手段在技术变革中也在悄然演变和进步,终端学习者对资源的获取、贡献与影响会越来越直接,由此必将进一步推动教育资源的建设共享规模以及强化其发展质量,所有这些对教育资源的有效组织与获取技术提出了更高的要求。而同时,巨量的教育资源处在开放、动态和多变的Internet环境下,位置分散、内容多样、实际描述标准不统一,针对特定学习目的,学习者往往较难实现有效的资源内容筛选与获取。如何利用文本信息技术实现资源语义层面的自动标识,关联整合不同组织、不同形式的教育资源数据,实现更为有效的教育资源组织和共享具有十分重要的理论和实用价值。为此,论文提出了基于关系形式概念(Relational Formal Concept, RFC)的教育资源语义互联模型——资源关联语义链网络(Resource 'Association Link Network,RALN),主要聚焦于三个关键研究问题:(1)针对开放的Web教育资源标识组织,如何引入更多的背景知识,提高资源模型的通用性与适应性,论文需要为背景知识的表达与获取提供灵活、通用的语义框架支持;(2)为了改善文本主题单纯依靠离散关键词统计特征的局限,使其获取与人类的并行阅读方式更为接近,论文在获取局部词条概念的同时,还需获取资源片段的上下文语境特征,更好发挥背景知识的效用;(3)针对个性化资源的时空动态性,如对于不同学习者和不同学习阶段,资源间的关联都可能存在差异或变化,资源模型在表达资源内容静态关联的同时,还应该具备动态学习能力,为教育资源语义标识、关联组织提供动态模型支持。论文针对以上问题进行了研究,主要内容为:(1)扩展了传统形式背景(Formal Context, FC),构建了关系形式概念模型(Relational Formal Concept Model, RFCM)。基于三元组关系构建的 RFCM,为实体词条(包括主体概念、客体概念)、实体关系(谓词概念)的语义描述提供了统一的形式化框架,即关系表达成主、客体概念、谓词概念。其中主、客体概念、谓词概念是关系不同侧面语义的集合二元组形式化体现,均由概念的内涵和外延两部分组成。论文基于关系形式概念模型,借助开放协作知识库(如百度百科、维基百科),自动获取其中的条目数据、标签数据作为关系形式背景的初始来源,以此构建关系形式概念背景知识;在关系形式概念提供的初始背景知识下,综合考虑词条上下文句法信息,本文采用图理论对实体词条间的关系形式概念连通度进行计算,实现实体关系的抽取、实体概念识别的协作处理,辅助关系形式背景的扩展学习,为资源标识提供动态的背景知识。关系形式概念模型作为一种协作、自组织的文本语义获取与表达模型,能为后续资源文本的主题抽取与表达、Web资源关联组织,提供更为灵活的形式化背景知识和统一的语义框架。(2)基于关系形式概念模型,为文本主题的定义与获取设计了完整的技术路线,构建了关系形式概念主题模型(Relational Formal Concept Topic Model,RFCTM)。RFCTM借助了关系形式概念背景知识,首先对实体词条的关系形式概念相关度进行计算;并综合考虑词条上下文句法信息,进行文本中关系形式概念的连通度语义计算,实现了从文本原始词条—词条主题—文本离散主题—文本连通主题的资源主题获取路径。相比离散关键词的主题表达,RFCTM具有关系形式概念更为灵活的语义表达粒度和更为完整的主题表达框架。现代系统科学认为[3]:新事物的性质以既有组成要素为基础,但又不能由组成要素完全说明,组成要素之间的特定内在联系才是事物的本质。该观点用以文本主题的分析同样适合,即词条是语义的基础,但离散词条及其概念也难以完全刻画文本语义主题。RFCTM则模拟了人的基于局部特征和基于语境的并行阅读认知方式,可以为基于内容的Web资源标识提供形式化的主题向量,为资源的关联组织提供基础的语义要素。(3)以文本主题模型为基础,为教育资源的标识与组织构建了基于语义的标识模型。该模型包括知识关联语义链网络(Knowledge Association Link Network,KALN)以及资源关联语义链网络(Resource Association Link Network, RALN)。KALN是由关系形式概念及其连接关系构建的知识网络,它为资源标识组织提供了基础的背景知识网络;RALN表达了资源文本片段间的语义关联关系。论文以资源片段的语义作为独立的主题模式,它也是RALN进行关联的逻辑结点,并对雷同的主题模式约简合并,以此减少在资源标识过程中的RALN结点增加速度,控制RALN的规模,提高资源的标识组织效率。由于KALN、RALN是由通用的开放协作知识库初始化的,针对特定的教育资源标识组织往往语义粒度过粗或缺少领域知识的支持,难以反映领域资源间特定关联或领域背景,需结合领域资源的内容作进一步扩展。(4)借助神经网络结构理论中的四个相关假设,对KALN进行了连接强度的计算扩展。论文模拟人类记忆的激活扩散、遗忘抑制机制,借助资源内容对关系形式概念的关联强度进行动态学习调整,使其不仅反映关系形式概念语义关联,还体现Web资源中关系形式概念的领域共现语义,使知识关联语义链网络与特定领域背景更为接近。论文还提出了基于资源文档的结构信息对RALN进行扩展的思路,使主题模式之间的关联不仅体现其包含的关系形式概念细粒度语义关联,也体现资源同一文档中的多主题模式间粗粒度领域关联。最后还对KALN与RALN增量更新算法进行了优化,提高模型的扩展学习效率。针对当前资源标识组织存在的问题,论文的创新性工作主要体现在:(1)扩展了形式背景(Formal Context, FC),定义了关系形式概念模型(Relational Formal Concept Model,RFCM),从形式上统一了词条、关联和概念间的语义表达,为文本主题的表达提供了 一个新思路;(2)基于关系形式概念的连通度概念,进行文本词条的连通度计算,为文本主题的获取提供了更多语境信息;(3)借鉴激活扩散、遗忘抑制的记忆认知规律,构建并扩展了资源关联语义链网络,为个性化学习与资源推荐提供了动态的模型适应能力。
【学位授予单位】:江西财经大学
【学位级别】:博士
【学位授予年份】:2016
【分类号】:G434;G254
【图文】:
图1.1邋CELTS-41技术规范数据结构逡逑
逦(2-3)逡逑概念格是所有形式概念在子概念和超概念下的序集。因此,概念格可以图形逡逑化表示为其所对应的Hasse图,表2.1概念格的Hasse图如图2.1所示。图2.1中逡逑的节点间存在表达式(2-1)、(2-2)、(2-3)定义的偏序或上下界关系。逡逑这使得给定数据背景的概念结构变得清晰和易于理解,从而实现了概念格的逡逑19逡逑
一),即它们在关系上是相邻的;F为边集£的权值,代表结点间关系度,即叭?%)邋=邋0_(%,邋%)。谓词概念、主体概念或客体概念间内涵,则认为它们在关系上也是相邻的。为明D图多结点连通思三元组P)的连通采用图3.1示意。逡逑
本文编号:2793019
【学位授予单位】:江西财经大学
【学位级别】:博士
【学位授予年份】:2016
【分类号】:G434;G254
【图文】:
图1.1邋CELTS-41技术规范数据结构逡逑
逦(2-3)逡逑概念格是所有形式概念在子概念和超概念下的序集。因此,概念格可以图形逡逑化表示为其所对应的Hasse图,表2.1概念格的Hasse图如图2.1所示。图2.1中逡逑的节点间存在表达式(2-1)、(2-2)、(2-3)定义的偏序或上下界关系。逡逑这使得给定数据背景的概念结构变得清晰和易于理解,从而实现了概念格的逡逑19逡逑
一),即它们在关系上是相邻的;F为边集£的权值,代表结点间关系度,即叭?%)邋=邋0_(%,邋%)。谓词概念、主体概念或客体概念间内涵,则认为它们在关系上也是相邻的。为明D图多结点连通思三元组P)的连通采用图3.1示意。逡逑
【引证文献】
相关期刊论文 前1条
1 李嘉骏;;语义Wiki构建E-Learning平台[J];电子技术与软件工程;2018年08期
本文编号:2793019
本文链接:https://www.wllwen.com/jiaoyulunwen/jiaoyugaigechuangxinlunwen/2793019.html
最近更新
教材专著