教师画像与评分系统的设计与实现
发布时间:2020-12-04 00:02
信息技术的进步为大数据时代的到来奠定了发展的基础,爆炸式的信息增长为数据挖掘提供了可供研究的数据基础。各行各业都在积极的应用数据挖掘技术来探索现有的数据中包含的潜在信息,教育领域也不例外。将数据挖掘技术运用于教育方面及教学场景中被称之为教育数据挖掘(Educational Data Mining,简称EDM)。EDM是一个交叉学科,涉及计算机科学与技术、统计学、教育学等多个知识领域。教学活动是指教师和学生互动的过程,教师在其中发挥着引导和给予的作用,是提高教学质量的关键。对老师的课程教学进行公正、客观地评价是激发教师热情工作,引导教师改进教学,提高教学质量的重要方法。在学生反馈这一方面,虽然目前高校都有学生评教系统,包含了打分和文字评价,但是对于这些数据的处理还停留在简单的统计分析阶段,普遍都是采用平均分的计算模式来对教师得到的打分进行处理,这种方法隐含了一些不合理的处理因素。其次是对文本的处理,大多依靠老师逐条阅读,这对于教务处和任课老师来说工作量都很大。目前的评教系统并未呈现教师画像,单靠返回的分数很难理解其具体含义。以此为背景,本文对学生评教的文本数据进行了数据挖掘与分析,生成了...
【文章来源】:重庆大学重庆市 211工程院校 985工程院校 教育部直属院校
【文章页数】:73 页
【学位级别】:硕士
【部分图文】:
教育数据挖掘的基本研究流程
w2,...,wT)=∏t=1Tp(wt|context) (公其中 s 代表当前的 sentence,w1 到 wT 为组成该句子的词。Context 表示境,p(wt|context)为在给定语境时,词 wt 出现的概率[48]。词向量模型的训练过程:Step1:为了训练出词向量,需要提前准备好语料库,由于本文使用的是中语言处理,所以在准备语料库的时候需要进行分词操作。Step2:扫描 step1 中准备的语料库,统计每个词语出现的频数并保存在一里。Step3: 根据词语出现的频率建立相应的哈夫曼树。哈夫曼树的每一个树己相对应的权值,这个权值与叶子结点到根节点所有的树枝的和就是该的权值。为了使树的代价比较小,权值大的叶子节点会比较靠近根节点好这样的哈夫曼树后,每个词都会有一个基于此哈夫曼树的二进制编码示从根节点到该词语的路径。比如我们假设左树枝的编码为 0,右树枝中红框内的词的哈夫曼编码就是 101。
pinion 的含义以及提取过程进行了说明,从初步提取到 OP 算法提取;接着对pinion 进行情感值计算,并把提取出的 Aspect 用词向量模型计算与六个教学评估度的相似性,把 Aspect 映射到相似性最高的维度上,最后基于六个维度进行情值求和,得到一个教师情感值矩阵,最终利用这个矩阵生成教师基于学生文本价的教师画像。.1 数据集.1.1 原始数据集本研究所用到的数据是 C 大学教务处提供的 2014-2016 年 C 大学学生评教数,共 6 学期。本次研究所用到的数据均以得到学校授权并预先对老师工号,课号,课程名称,学号,学生姓名做了加密处理,不会侵犯学生和教师的隐私。学生评教的原始数据如图所示,关键字 TEACH_TERM 为上课学期,SER_KCID 为课程 ID 号,ZWMC 为课程名称,BJMC 为班级名称,QTYJ 指学的文本评语,最后一列为学生对老师的综合评分。部分评教数据如图 3.1 所示。
本文编号:2896677
【文章来源】:重庆大学重庆市 211工程院校 985工程院校 教育部直属院校
【文章页数】:73 页
【学位级别】:硕士
【部分图文】:
教育数据挖掘的基本研究流程
w2,...,wT)=∏t=1Tp(wt|context) (公其中 s 代表当前的 sentence,w1 到 wT 为组成该句子的词。Context 表示境,p(wt|context)为在给定语境时,词 wt 出现的概率[48]。词向量模型的训练过程:Step1:为了训练出词向量,需要提前准备好语料库,由于本文使用的是中语言处理,所以在准备语料库的时候需要进行分词操作。Step2:扫描 step1 中准备的语料库,统计每个词语出现的频数并保存在一里。Step3: 根据词语出现的频率建立相应的哈夫曼树。哈夫曼树的每一个树己相对应的权值,这个权值与叶子结点到根节点所有的树枝的和就是该的权值。为了使树的代价比较小,权值大的叶子节点会比较靠近根节点好这样的哈夫曼树后,每个词都会有一个基于此哈夫曼树的二进制编码示从根节点到该词语的路径。比如我们假设左树枝的编码为 0,右树枝中红框内的词的哈夫曼编码就是 101。
pinion 的含义以及提取过程进行了说明,从初步提取到 OP 算法提取;接着对pinion 进行情感值计算,并把提取出的 Aspect 用词向量模型计算与六个教学评估度的相似性,把 Aspect 映射到相似性最高的维度上,最后基于六个维度进行情值求和,得到一个教师情感值矩阵,最终利用这个矩阵生成教师基于学生文本价的教师画像。.1 数据集.1.1 原始数据集本研究所用到的数据是 C 大学教务处提供的 2014-2016 年 C 大学学生评教数,共 6 学期。本次研究所用到的数据均以得到学校授权并预先对老师工号,课号,课程名称,学号,学生姓名做了加密处理,不会侵犯学生和教师的隐私。学生评教的原始数据如图所示,关键字 TEACH_TERM 为上课学期,SER_KCID 为课程 ID 号,ZWMC 为课程名称,BJMC 为班级名称,QTYJ 指学的文本评语,最后一列为学生对老师的综合评分。部分评教数据如图 3.1 所示。
本文编号:2896677
本文链接:https://www.wllwen.com/jiaoyulunwen/gaodengjiaoyulunwen/2896677.html