当前位置:主页 > 教育论文 > 课堂教学论文 >

如何分析慕课论坛中的数据:六大分析方法述评

发布时间:2021-11-20 15:03
  课程论坛是慕课师生交互和生生交互最主要的发生场所,面对其中不断生成的数据,如何选择合适的方法分析和了解论坛的教学和交互活动并优化论坛环境,是慕课研究者们关注的重要问题。以Web of Science Core Collection和Science Direct为文献来源数据库,选取2014-2018年与慕课论坛(MOOC forum)数据分析最相关的30篇英文文献,结合实例详细阐述网络志、内容分析、数理统计、聚类分析、网络分析、文本挖掘等6类方法的具体分析过程。在此基础上,探讨以上方法及现有数据分析的局限,并为未来研究者分析慕课论坛数据提出建议:将数据分析结果服务于慕课利益相关者;加强对慕课论坛的动态分析;探讨相关背景,逐步扩大研究的推广范围。 

【文章来源】:现代远距离教育. 2019,(06)北大核心CSSCI

【文章页数】:10 页

【部分图文】:

如何分析慕课论坛中的数据:六大分析方法述评


同伴交互网络结构图

文本,主题,步骤


对慕课讨论帖的主题进行分类与识别的步骤具体如图2所示。其中文本预处理包括文本清洗、文本分词、去除停用词等,对文本挖掘的效果至关重要;由于计算机程序不能直接对自然语言进行理解,需要把文本转化成能够被计算机识别的形式,这就是文本表示过程的作用;特征提取则是将无关信息摒弃、关键特征信息提取出来的过程,通过构造函数评估每个特征,选择最佳特征作为特征子集,然后选择合适的分类算法完成分类器的构建,对未知类别的测试集进行预测分类[48]。文本主题分类研究的核心内容是特征提取和分类器算法选取这两部分。针对论坛信息过载的问题,布林顿(Brinton)等利用亚马逊(Amazon)提供MTurk众包服务,雇佣工人对所有训练集主题帖的特征进行人工标记,结合支持向量机和朴素贝叶斯,对主题帖进行分类并通过真阳率、假阳率证明两种模型有效性[31]。宋(Song)等则选择隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)主题模型从讨论帖文档中提取主题特征,通过LDA构建文本主题分布,挖掘文本的整体语义表达,并选择支持向量机完成分类器的构建[33]。


本文编号:3507575

资料下载
论文发表

本文链接:https://www.wllwen.com/jiaoyulunwen/ktjx/3507575.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户fde8d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com