大型开放式在线教育中大数据的文本分类研究
本文关键词:大型开放式在线教育中大数据的文本分类研究,由笔耕文化传播整理发布。
【摘要】:“互联网+”是当前应对经济结构转型,创建经济新增长点的一个重要突破。电信业、制造业、金融业等传统产业都在进一步地与互联网相融合。“互联网+传统产业”的模式正成为国家发展的重要战略。“互联网+传统教育”即大型开放式网络课程(Massively Open Online Courses,MOOC)作为现代教育的一种新趋势,越来越受到各个方面的关注。然而,跟踪MOOC网站上用户的行为并从他们反馈的大数据中挖掘出有效信息为决策者提供支持是当前面临的主要问题。为此,本课题将针对大型开放式网络课程的特点使用大数据在文本分类分析过程中的一些关键性技术对MOOC网站上抓取到的大量用户评论数据进行情感倾向预测分类。本文的主要思路是:首先通过介绍大数据分析和数据挖掘的相关理论与技术明确本课题的研究内容是分布式分类计算;其次阐述与本课题相关的几种分类算法以及它们的Map Reduce并行化方式;然后给出对MOOC网站上的用户评论内容通过文本向量化和特征选择法相结合进行情感倾向分类的流程;最后参照前文的流程和方法进行算法实验,对比得出最优实验组合,并使用最优实验组合对网易公开课中抓取到的大量用户评论数据进行文本的情感倾向预测分类。
【关键词】:大数据 数据挖掘 分布式计算 文本情感分类 Massively Open Online Courses
【学位授予单位】:西华师范大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.1;G434
【目录】:
- 摘要5-6
- Abstract6-7
- 第1章 前言7-12
- 1.1 课题背景7-8
- 1.2 研究意义8-9
- 1.3 国内外研究现状9-10
- 1.4 课题主要研究内容10-12
- 第2章 大数据相关理论与技术12-22
- 2.1 大数据及其相关技术12-13
- 2.1.1 大数据的定义12-13
- 2.2 大数据相关技术13-19
- 2.3 大数据分析19-22
- 2.3.1 数据探索和数据挖掘20
- 2.3.2 数据挖掘20-22
- 第3章 分布式分类计算22-32
- 3.1 分类预测22-27
- 3.1.1 分布式分类计算22-23
- 3.1.2 分类原理23-24
- 3.1.3 文本情感分类的流程24-27
- 3.2 相似性度量27-28
- 3.3 最近邻KNN分类28-30
- 3.3.1 KNN基本原理28-29
- 3.3.2 KNN MapReduce并行化29-30
- 3.4 质心分类30
- 3.4.1 质心分类的基本原理30
- 3.4.2 质心分类并行化30
- 3.5 贪婪贝叶斯30-31
- 3.6 支持向量机31-32
- 第4章 MOOC网站中用户评论的文本情感分类过程32-38
- 4.1 文本情感分类的方法32-33
- 4.2 文本情感分类33-36
- 4.2.1 数据收集33-34
- 4.2.2 文本向量化34-36
- 4.2.3 特征选择36
- 4.3 用户评论数据情感分类36-38
- 第5章 算法实验38-42
- 5.1 实验环境搭建38-40
- 5.1.1 集群规划38
- 5.1.2 软件准备38-40
- 5.2 实验数据40
- 5.3 实验过程和结果40-42
- 第6章 总结与展望42-44
- 6.1 本课题的研究总结42
- 6.2 本课题的创新之处42-43
- 6.3 本课题的不足以及对未来工作的展望43-44
- 参考文献44-46
- 致谢46-49
- 在学期间的科研情况49
【相似文献】
中国期刊全文数据库 前10条
1 叶真;让笑声给教学带来生机[J];成都体院学报;1987年04期
2 白冰;;虚构·假说·磨玉——情感倾向的生成[J];赤峰学院学报(汉文哲学社会科学版);2007年02期
3 刘洪高;;谈《荷塘月色》的情感倾向[J];荆州师专学报;1993年03期
4 少木森;;青年教师的职业情感倾向初探[J];思想政治课教学;1987年06期
5 刘晓琦;;语文教学应体现教师的情感倾向[J];现代语文(文学研究);2011年07期
6 姚玺;;支持资源作用下的工作-家庭促进:情感倾向的调节作用[J];经营管理者;2013年05期
7 张有志;;探寻文字风格之美[J];同学少年;2008年12期
8 刘凤英;;青春期学生情感倾向调查及引导[J];中小学心理健康教育;2008年14期
9 周来祥;;谈共鸣问题[J];山东大学学报(中国语言文学版);1961年S4期
10 刘晓红;;动物成语与汉民族的情感倾向[J];语文知识;2000年04期
中国重要会议论文全文数据库 前4条
1 杨江;侯敏;王宁;;基于主题情感句的汉语评论文倾向性分析[A];第五届全国青年计算语言学研讨会论文集[C];2010年
2 林慧恩;林世平;;中文情感倾向分析中主观句子抽取方法的研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
3 王素格;杨安娜;;一种混合语言信息的词语搭配倾向判别方法[A];第五届全国信息检索学术会议论文集[C];2009年
4 宋晓雷;王素格;李红霞;;基于概率潜在语义分析的词汇情感倾向判别[A];第五届全国青年计算语言学研讨会论文集[C];2010年
中国重要报纸全文数据库 前3条
1 唐楠;新闻应避免情感倾向[N];中国新闻出版报;2005年
2 鲁东;不尽乡情入画来[N];中国文化报;2001年
3 杨勇涛;让摄影唤起心灵的本真[N];中国摄影报;2005年
中国博士学位论文全文数据库 前6条
1 房磊;融合知识的情感分析研究[D];清华大学;2015年
2 张奇;细颗粒度情感倾向分析若干关键问题研究[D];复旦大学;2008年
3 王素格;基于Web的评论文本情感分类问题研究[D];上海大学;2008年
4 杨卉;Web文本观点挖掘及隐含情感倾向的研究[D];吉林大学;2011年
5 李思;WEB观点挖掘中关键问题的研究[D];北京邮电大学;2012年
6 李方涛;基于产品评论的情感分析研究[D];清华大学;2011年
中国硕士学位论文全文数据库 前10条
1 王帅;情感分析的特征提取算法与观点的聚类算法研究[D];昆明理工大学;2015年
2 冯金刚;网络舆情中文信息情感倾向分析研究[D];华北电力大学;2015年
3 魏从源;网络信息的情感倾向分类技术研究[D];国防科学技术大学;2013年
4 周冬卫;中文微博评论的情感倾向分析[D];华东交通大学;2015年
5 吴斐;跨领域条件下词汇情感倾向判别方法研究[D];合肥工业大学;2015年
6 徐凯;基于产品特征的用户评论情感倾向分析研究[D];合肥工业大学;2015年
7 王格;网络评论的情感倾向分析[D];武汉工程大学;2015年
8 刘其;基于用户评论的群体情绪识别与演化研究[D];东华大学;2015年
9 张佳明;微博话题的公众情感分析技术研究[D];解放军信息工程大学;2015年
10 唐浩浩;面向事件的微博情感倾向性分析技术研究[D];解放军信息工程大学;2014年
本文关键词:大型开放式在线教育中大数据的文本分类研究,由笔耕文化传播整理发布。
,本文编号:459688
本文链接:https://www.wllwen.com/jiaoyulunwen/jiaoyutizhilunwen/459688.html