当前位置:主页 > 教育论文 > 课堂教学论文 >

基于联通主义的自适应Web信息抽取研究

发布时间:2021-05-26 18:11
  随着大数据时代的到来,人们可以通过网络获得不断更新的学习资源,通过整合并结构化存储这些学习资源,可以实现对学习资源的链接,并且便于对学习资源的加工重用。这一过程与联通主义所支持的“学习即在节点间建立链接”、“知识不断更新”的思想相呼应。为实现这一过程,需要对自适应的Web信息抽取技术进行研究,将半结构化或非结构化的网页内容抽取出结构化的信息。本文将汇聚了名校精品课程的MOOC平台作为研究对象。在MOOC平台中,知识以课程为单位存储在网页中。本文通过借鉴主流的信息抽取技术,结合联通主义的知识观与学习观,进行了自适应Web信息抽取研究。研究经历了从课程属性到课程关系的抽取过程。首先,本文提出了基于模板与特征相结合的课程属性抽取方法。该方法通过计算文本节点信息熵的方式,挖掘出网站中的公共部分、标识出可选部分,从而生成抽取模板,之后采样目标抽取信息,结合与文本内容无关的四类局部文本特征,最终生成针对课程不同属性的特征向量,通过特征向量对模板抽取结果进行筛选;其次,本文提出跨网页的课程关系抽取方法。在研究中预设了课程的三种关系,针对不同关系选用不同的课程属性作为比对数据源,并为不同文本类型(描述... 

【文章来源】:东北石油大学黑龙江省

【文章页数】:64 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
创新点摘要
第一章 绪论
    1.1 研究背景
    1.2 研究意义
    1.3 研究方法
    1.4 研究内容
    1.5 本文组织结构
第二章 背景技术与理论
    2.1 Web信息抽取概述
        2.1.1 Web信息抽取发展现状
        2.1.2 Web信息抽取的主要方法
        2.1.3 Web信息抽取评价标准
    2.2 联通主义学习理论
        2.2.1 联通主义学习理论发展现状
        2.2.2 联通主义学习理论支撑
    2.3 本章小结
第三章 基于模板与特征相结合的Web属性抽取
    3.1 引言
    3.2 网页的组成
    3.3 自适应信息抽取算法模型
    3.4 信息抽取准备工作
        3.4.1 URL匹配
        3.4.2 全网站网页抽取
    3.5 基于文本节点信息熵计算的模板生成
        3.5.1 模板节点与可选节点识别
        3.5.2 基于序列比对的模板生成方法
        3.5.3 自下而上的模板抽取
        3.5.4 抽取结果
    3.6 基于特征提取的课程属性值识别
        3.6.1 课程属性局部特征模型
        3.6.2 特征训练方法
        3.6.3 特征的使用
        3.6.4 抽取结果
    3.7 本章小结
第四章 基于MOOC平台的课程关系抽取
    4.1 引言
    4.2 课程实体关系设计
    4.3 语料获取
        4.3.1 课程名抽取
        4.3.2 知识点抽取
    4.4 跨网页关系抽取
        4.4.1 基于实体类属性文本的课程链接
        4.4.2 基于描述类属性文本的课程连接
    4.5 课程逻辑关系抽取
    4.6 实验分析
    4.7 本章小结
第五章 基于MOOC的高等计算机课程知识图谱设计与实现
    5.1 引言
    5.2 数据获取
    5.3 课程信息架构设计
    5.4 关系知识组织
    5.5 课程关系抽取
    5.6 关系知识的存储
    5.7 知识内容的更新
    5.8 知识图谱的可视化
    5.9 本章小结
结论
参考文献
附录 1 样本局部特征图
发表文章目录
致谢


【参考文献】:
期刊论文
[1]一种融合语义角色和依存句法的实体关系抽取算法[J]. 秦晓慧,侯霞,赵雪.  北京信息科技大学学报(自然科学版). 2019(01)
[2]基于关联主义的成人学习者学习资源设计策略[J]. 王丽川,崔亮,王志国.  成人教育. 2017(09)
[3]面向机构知识库的课程信息元数据抽取系统设计与实现[J]. 陈雅迪,张雪蕾,李娟.  情报探索. 2017(07)
[4]微博中的开放域事件抽取[J]. 陈箫箫,刘波.  计算机应用与软件. 2016(08)
[5]“互联网+”教育环境下基于联通主义理论的移动学习资源设计研究[J]. 赵书静,白敏.  教育教学论坛. 2016(28)
[6]基于关联主义的高校开放课程资源平台设计[J]. 曹茜,郝超平,徐世东.  中国教育信息化. 2015(09)
[7]联通主义学习理论及其最新进展[J]. 王志军,陈丽.  开放教育研究. 2014(05)
[8]面向中文网络百科的属性和属性值抽取[J]. 贾真,杨宇飞,何大可,刘胜久,尹红风.  北京大学学报(自然科学版). 2014(01)
[9]面向非结构化文本的开放式实体属性抽取[J]. 曾道建,来斯惟,张元哲,刘康,赵军.  江西师范大学学报(自然科学版). 2013(03)
[10]网页中商品“属性—值”关系的自动抽取方法研究[J]. 唐伟,洪宇,冯艳卉,姚建民,朱巧明.  中文信息学报. 2013(01)

博士论文
[1]精确Web信息抽取关键技术与系统研究[D]. 施生生.南京大学 2017
[2]面向开放领域文本的实体关系抽取[D]. 郭喜跃.华中师范大学 2016
[3]关联主义学习理论及其视角下的教与学组织研究[D]. 刘菊.东北师范大学 2011
[4]信息抽取中实体关系识别研究[D]. 张奇.中国科学技术大学 2010
[5]信息抽取中关键技术的研究[D]. 张素香.北京邮电大学 2007

硕士论文
[1]MOOC环境下课程智能问答系统的设计与实现[D]. 曲强.延边大学 2018
[2]基于MOOC的高等教育知识图谱的构建[D]. 侯俊萌.北京邮电大学 2017
[3]自适应Web数据抽取技术研究[D]. 陈晓雷.辽宁大学 2016
[4]联通主义学习理论视角下大学生自主学习能力培养研究[D]. 宁通.郑州大学 2015
[5]基于信息熵的Web信息抽取技术研究[D]. 张奇.广东工业大学 2013
[6]基于语义角色标注的微博人物关系抽取[D]. 廉营.哈尔滨工业大学 2013
[7]精确Web信息抽取集成模型与关键技术研究[D]. 解涛.南京大学 2011
[8]基于最大熵方法的评论信息抽取研究[D]. 赵丽芳.上海交通大学 2009
[9]信息化教育领域的Web信息抽取技术研究[D]. 邱亚娜.天津师范大学 2008
[10]Web教学资源抽取技术及其应用研究[D]. 刘洋.东北师范大学 2007



本文编号:3206827

资料下载
论文发表

本文链接:https://www.wllwen.com/jiaoyulunwen/ktjx/3206827.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d7405***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com