基于机器学习的慕课论坛主题分类研究
发布时间:2021-04-12 12:10
慕课(Massive open online courses,MOOC)的兴起和发展,使得在线教育成为了现在最受欢迎的教育模式之一,如何改善在线教育的教学质量也成为了数据挖掘中一个比较热门的应用研究方向。慕课论坛是慕课课程中学生与老师、助教进行交流的唯一平台,是直接关乎到整个课程质量的重要因素。对慕课论坛的主题进行合理准确的分类可以帮助学生更好地交流和提问问题,更加有效率地解决学习中遇到的困难。以往对慕课论坛主题分类的研究多是用自然语言处理或者文本分析的技术,首先提取论坛文本的关键词,然后利用关键词构建文本特征对论坛主题进行分类。但是由于不同课程的论坛内容差异巨大,论坛用户交流使用的语言多种多样,导致在一个课程上训练好的主题分类模型,很难直接从特定的论坛推广应用到其他论坛。针对这些问题,本文提出了一种基于用户行为特征的慕课论坛主题分类框架。本文首先分析了最大的慕课平台Coursera上60门课程的论坛用户行为特征数据,并收集分析了3门最热的Coursera中英文课程的论坛文本数据,证明了用户行为特征数据也可以较好地区分不同种类的慕课论坛主题。接着从主题的结构,主题的潜在社会网络,主题的...
【文章来源】:大连理工大学辽宁省 211工程院校 985工程院校 教育部直属院校
【文章页数】:65 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.2.1 基于论坛文本特征的慕课论坛主题分类
1.2.2 基于用户行为特征的慕课论坛主题分类
1.3 主要内容及章节安排
1.3.1 主要内容
1.3.2 章节安排
2 相关理论及定义
2.1 引言
2.2 欠采样学习算法
2.2.1 随机欠采样
2.2.2 原型生成欠采样
2.2.3 原型选择欠采样
2.3 过采样学习算法
2.3.1 随机过采样
2.3.2 样本合成过采样
2.4 代价敏感学习
2.4.1 代价敏感支持向量机
2.4.2 自适应提升代价敏感算法
3 基于用户行为特征的慕课论坛主题分类
3.1 引言
3.2 主题文本特征
3.3 用户行为特征
3.3.1 用户行为特征分析
3.3.2 用户行为特征选取
3.3.3 用户行为特征可视化
3.4 主题分类实验结果与分析
3.4.1 实验设置
3.4.2 评估准则
3.4.3 实验结果分析
3.5 本章小结
4 基于特征融合的慕课论坛主题分类
4.1 引言
4.2 梯度提升树特征融合算法
4.2.1 梯度提升树
4.2.2 单棵决策树特征融合
4.2.3 梯度提升树特征融合
4.3 主题分类实验结果与分析
4.3.1 实验设置
4.3.2 实验结果与分析
4.4 本章小结
结论
参考文献
攻读硕士学位期间发表学术论文情况
致谢
【参考文献】:
期刊论文
[1]基于MOOC数据的学习行为分析与预测[J]. 蒋卓轩,张岩,李晓明. 计算机研究与发展. 2015(03)
[2]文本分类中词语权重计算方法的改进与应用[J]. 熊忠阳,黎刚,陈小莉,陈伟. 计算机工程与应用. 2008(05)
[3]基于信息增益的特征词权重调整算法研究[J]. 张玉芳,陈小莉,熊忠阳. 计算机工程与应用. 2007(35)
[4]基于文本分类TFIDF方法的改进与应用[J]. 张玉芳,彭时名,吕佳. 计算机工程. 2006(19)
本文编号:3133271
【文章来源】:大连理工大学辽宁省 211工程院校 985工程院校 教育部直属院校
【文章页数】:65 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.2.1 基于论坛文本特征的慕课论坛主题分类
1.2.2 基于用户行为特征的慕课论坛主题分类
1.3 主要内容及章节安排
1.3.1 主要内容
1.3.2 章节安排
2 相关理论及定义
2.1 引言
2.2 欠采样学习算法
2.2.1 随机欠采样
2.2.2 原型生成欠采样
2.2.3 原型选择欠采样
2.3 过采样学习算法
2.3.1 随机过采样
2.3.2 样本合成过采样
2.4 代价敏感学习
2.4.1 代价敏感支持向量机
2.4.2 自适应提升代价敏感算法
3 基于用户行为特征的慕课论坛主题分类
3.1 引言
3.2 主题文本特征
3.3 用户行为特征
3.3.1 用户行为特征分析
3.3.2 用户行为特征选取
3.3.3 用户行为特征可视化
3.4 主题分类实验结果与分析
3.4.1 实验设置
3.4.2 评估准则
3.4.3 实验结果分析
3.5 本章小结
4 基于特征融合的慕课论坛主题分类
4.1 引言
4.2 梯度提升树特征融合算法
4.2.1 梯度提升树
4.2.2 单棵决策树特征融合
4.2.3 梯度提升树特征融合
4.3 主题分类实验结果与分析
4.3.1 实验设置
4.3.2 实验结果与分析
4.4 本章小结
结论
参考文献
攻读硕士学位期间发表学术论文情况
致谢
【参考文献】:
期刊论文
[1]基于MOOC数据的学习行为分析与预测[J]. 蒋卓轩,张岩,李晓明. 计算机研究与发展. 2015(03)
[2]文本分类中词语权重计算方法的改进与应用[J]. 熊忠阳,黎刚,陈小莉,陈伟. 计算机工程与应用. 2008(05)
[3]基于信息增益的特征词权重调整算法研究[J]. 张玉芳,陈小莉,熊忠阳. 计算机工程与应用. 2007(35)
[4]基于文本分类TFIDF方法的改进与应用[J]. 张玉芳,彭时名,吕佳. 计算机工程. 2006(19)
本文编号:3133271
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3133271.html