在线教育课程评论文本情感倾向性研究
【图文】:
结构的分析,我们首先需要拿到该网站英语模块的链接,在该页面下会显示所有的英语课程,通常用户只需要点进去就可以查看该课程的详情。该网站的英语模块的页面如图3.3所示。图3.3 网易云课堂英语模块页面图我们查看该页面的源码,该页面的源码上拥有各个课程模块的链接、标题、讲师等信息,我们通过正则表达式可以实现对链接、标题、讲师等信息的定位。具体的做法是使用 WebDriver 实例化一个浏览器,浏览该英语模块的页面并获取整个页面源码,然后使用 HTMLParser 包的正则表达式对页面进行解析,这样就可以得到每个课程模块的链接、课程名、讲师等信息。我们将获取到的每个课程模块的链接放入 URL 库中等待评论文本的抓取。我们再实例化一个浏览器浏览URL 库中的课程模块链接,点击评论区的“查看更多”,,对该页面的源码进行解析获取课程评论文本,该网站课程评论文本示例如图 3.4 所示。
图 3.4 课程评论文本示例图需要注意的是由于上图中的课程评论文本是通过 Ajax 异步加载的,所以码在点击评论区的“查看更多”之后才会显示出来,如果直接在当前页析将无法获取评论文本。通过对网易云课堂英语课程评论文本的爬取,本实验的数据共 8569 条,课程评论数据样例如表 3.1 所示。
【学位授予单位】:江西财经大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:G434
【参考文献】
相关期刊论文 前10条
1 贺杰;;基于Webdriver爬虫技术的研究[J];科技广场;2016年10期
2 杨现民;王榴卉;唐斯斯;;教育大数据的应用模式与政策建议[J];电化教育研究;2015年09期
3 孟卓;袁梅宇;;教育数据挖掘发展现状及研究规律的分析[J];教育导刊;2015年02期
4 DENG ChenWei;HUANG GuangBin;XU Jia;TANG JieXiong;;Extreme learning machines: new trends and applications[J];Science China(Information Sciences);2015年02期
5 胡艺龄;顾小清;赵春;;在线学习行为分析建模及挖掘[J];开放教育研究;2014年02期
6 徐鹏;王以宁;刘艳华;张海;;大数据视角分析学习变革——美国《通过教育数据挖掘和学习分析促进教与学》报告解读及启示[J];远程教育杂志;2013年06期
7 唐晓波;肖璐;;基于情感分析的评论挖掘模型研究[J];情报理论与实践;2013年07期
8 王洪伟;郑丽娟;尹裴;史伟;;在线评论的情感极性分类研究综述[J];情报科学;2012年08期
9 郑艳红;张东站;;基于同义词词林的文本特征选择方法[J];厦门大学学报(自然科学版);2012年02期
10 赵妍妍;秦兵;刘挺;;文本情感分析[J];软件学报;2010年08期
相关会议论文 前1条
1 罗海飞;虞立群;章志凌;邵晓敏;陈林;汪更生;陈弈秋;何伟杰;;一种改进型CHI的特征抽取方法[A];第二十四届中国控制会议论文集(下册)[C];2005年
相关重要报纸文章 前1条
1 倪闽景;;教育大数据的价值判断[N];中国教师报;2016年
相关博士学位论文 前2条
1 刘智;课程评论的情感倾向识别与话题挖掘技术研究[D];华中师范大学;2014年
2 平源;基于支持向量机的聚类及文本分类研究[D];北京邮电大学;2012年
相关硕士学位论文 前5条
1 崔连超;互联网评论文本情感分析研究[D];山东大学;2015年
2 李然;基于深度学习的短文本情感倾向性研究[D];北京理工大学;2015年
3 马治涛;文本分类停用词处理和特征选择技术研究[D];西安电子科技大学;2014年
4 王t熺
本文编号:2558364
本文链接:https://www.wllwen.com/jiaoyulunwen/jiaoyutizhilunwen/2558364.html