当前位置:主页 > 教育论文 > 教育体制论文 >

在线教育课程评论文本情感倾向性研究

发布时间:2019-11-09 08:56
【摘要】:在线教育平台是新兴事物,它使得教学得以在互联网上开展,由于其学习的便捷性吸引了众多的教师与学生在这种平台上开展教学活动。随着用户量的日益增多,在线教育平台上积累的教育数据也越来越多,学生上课的数据被无形地无时无刻地记录下来,这些数据成为了教育界的大数据,研究学者对这些数据进行挖掘就可以对学生的成绩进行预测、对教师的教学进行评价等。目前我国出现了很多在线学习的平台,各大高校的MOOC平台建设也正在如火如荼地进行中,但是平台上一些课程的教学质量却并没有得到应有的规范和完善,对此很多学生会遇到学习完课程之后发现并不适合自己的问题。基于此,文本对在线教育平台上积累的课程评论数据进行研究分析,这些课程评论为学生上完课之后的课程评价,能够反映出已上该课程的学生对该课程的情感态度,对这些评论数据进行情感倾向性研究可以对教师的教学质量进行评价,也可以为后续想要选择这门课程的学生提供决策建议。本研究选用网易云课堂上英语模块下的课程评论文本作为实验的初始数据,这些数据通过基于WebDriver的爬虫程序可以进行爬取。在爬取到数据之后,本人对数据进行处理,将没用的数据诸如灌水、广告等文本剔除之后得到实验所需的数据集共5000条评论文本。在获得实验数据集之后,本文基于目前主流的情感词典和机器学习两种文本情感分析方法对课程评论文本进行情感倾向性分析,其中情感词典的实验采用PMI算法进行,机器学习的实验采用SVM算法进行。在PMI算法的实验当中,文本使用NTUSD情感词典,基于默认的参考词汇与基于词频最高的三组参考词汇分别进行了课程评论文本的分类实验,实验结果发现后者的文本分类效果更佳。在SVM算法的实验当中,本文使用LibSVM工具进行训练集的训练与测试集的测试,选用多项式核函数,最终实验的分类效果明显好于基于PMI算法中采用默认参考词汇的实验,略逊于采用词频最高的三组参考词汇的实验。本文在对以上的实验进行分析之后,根据其各自的优缺点提出了改进实验的方案:加入停用词处理、加入否定词分析、SVM核函数调优。本文将基于情感词典和基于机器学习两种方法的实验综合起来,对于待分类文本中否定词分析生效的文本采用基于情感词典的PMI算法进行文本情感分类,对于剩余的待分类文本采用基于机器学习的SVM算法进行文本情感分类,最后将两者的分类结果综合得出最终的实验结果,实验结果表明了采用这种方法对文本进行情感分类后分类的效果都要好于之前的实验。本文对在线课程评论文本的情感倾向性研究目前属于情感极性二分类范畴,对于多分类的问题暂未涉及,随着教育大数据的发展,有关课程评论文本情感倾向性研究将会越来越多,这将进一步丰富文本情感分析理论。
【图文】:

网易,英语,页面,课堂


结构的分析,我们首先需要拿到该网站英语模块的链接,在该页面下会显示所有的英语课程,通常用户只需要点进去就可以查看该课程的详情。该网站的英语模块的页面如图3.3所示。图3.3 网易云课堂英语模块页面图我们查看该页面的源码,该页面的源码上拥有各个课程模块的链接、标题、讲师等信息,我们通过正则表达式可以实现对链接、标题、讲师等信息的定位。具体的做法是使用 WebDriver 实例化一个浏览器,浏览该英语模块的页面并获取整个页面源码,然后使用 HTMLParser 包的正则表达式对页面进行解析,这样就可以得到每个课程模块的链接、课程名、讲师等信息。我们将获取到的每个课程模块的链接放入 URL 库中等待评论文本的抓取。我们再实例化一个浏览器浏览URL 库中的课程模块链接,点击评论区的“查看更多”,,对该页面的源码进行解析获取课程评论文本,该网站课程评论文本示例如图 3.4 所示。

评论文,课程


图 3.4 课程评论文本示例图需要注意的是由于上图中的课程评论文本是通过 Ajax 异步加载的,所以码在点击评论区的“查看更多”之后才会显示出来,如果直接在当前页析将无法获取评论文本。通过对网易云课堂英语课程评论文本的爬取,本实验的数据共 8569 条,课程评论数据样例如表 3.1 所示。
【学位授予单位】:江西财经大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:G434

【参考文献】

相关期刊论文 前10条

1 贺杰;;基于Webdriver爬虫技术的研究[J];科技广场;2016年10期

2 杨现民;王榴卉;唐斯斯;;教育大数据的应用模式与政策建议[J];电化教育研究;2015年09期

3 孟卓;袁梅宇;;教育数据挖掘发展现状及研究规律的分析[J];教育导刊;2015年02期

4 DENG ChenWei;HUANG GuangBin;XU Jia;TANG JieXiong;;Extreme learning machines: new trends and applications[J];Science China(Information Sciences);2015年02期

5 胡艺龄;顾小清;赵春;;在线学习行为分析建模及挖掘[J];开放教育研究;2014年02期

6 徐鹏;王以宁;刘艳华;张海;;大数据视角分析学习变革——美国《通过教育数据挖掘和学习分析促进教与学》报告解读及启示[J];远程教育杂志;2013年06期

7 唐晓波;肖璐;;基于情感分析的评论挖掘模型研究[J];情报理论与实践;2013年07期

8 王洪伟;郑丽娟;尹裴;史伟;;在线评论的情感极性分类研究综述[J];情报科学;2012年08期

9 郑艳红;张东站;;基于同义词词林的文本特征选择方法[J];厦门大学学报(自然科学版);2012年02期

10 赵妍妍;秦兵;刘挺;;文本情感分析[J];软件学报;2010年08期

相关会议论文 前1条

1 罗海飞;虞立群;章志凌;邵晓敏;陈林;汪更生;陈弈秋;何伟杰;;一种改进型CHI的特征抽取方法[A];第二十四届中国控制会议论文集(下册)[C];2005年

相关重要报纸文章 前1条

1 倪闽景;;教育大数据的价值判断[N];中国教师报;2016年

相关博士学位论文 前2条

1 刘智;课程评论的情感倾向识别与话题挖掘技术研究[D];华中师范大学;2014年

2 平源;基于支持向量机的聚类及文本分类研究[D];北京邮电大学;2012年

相关硕士学位论文 前5条

1 崔连超;互联网评论文本情感分析研究[D];山东大学;2015年

2 李然;基于深度学习的短文本情感倾向性研究[D];北京理工大学;2015年

3 马治涛;文本分类停用词处理和特征选择技术研究[D];西安电子科技大学;2014年

4 王t熺

本文编号:2558364


资料下载
论文发表

本文链接:https://www.wllwen.com/jiaoyulunwen/jiaoyutizhilunwen/2558364.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户caa9b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com