面向高教人才培养质量社会评价的文本分析方法研究

发布时间:2022-11-06 12:39
  随着国家教育事业的蓬勃发展,关于人才素质的培养不断受到重视,“数据驱动学校,分析变革教育”的大数据时代已经到来。紧随着移动互联网的快速发展,使得网络中产生大量关于高教在培养人才质量方面的评价数据,这些数据对研究如何提高人才培养质量具有重要价值,所以迫切需要利用文本分析技术对这些数据进行有效的抓取及合理的分析,实现对目标数据的自动化采集与分析,从而为相关部门提供人才培养方面的决策支持。因此,本文提出构建面向高教人才培养质量社会评价数据文本分析方法,对此进行了以下研究:(1)针对互联网社交媒体网站的结构不同,制定多源数据采集方案,设计网络爬虫爬取目标数据。在此基础上,进一步完成对高教人才培养质量指标体系的构建,最终制定出标准数据集。(2)针对高等教育人才培养质量社会评价数据集进行文本情感分析。考虑数据来源的网络环境以及数据的领域性,在基础的情感词典中加入社交网络词典和领域词典,从而制定一种基于改进情感词典的文本情感强度计算方法。(3)针对高等教育人才培养质量社会评价数据集进行文本分类。鉴于文本数据的语义特性和上下文关联性,引入循环神经网络(RNN)来解决上下文语义关联性问题,并融合注意力模... 

【文章页数】:76 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第一章 绪论
    1.1 研究背景与意义
    1.2 国内外研究现状
        1.2.1 教育数据挖掘研究现状
        1.2.2 文本分类研究现状
        1.2.3 文本情感分析研究现状
    1.3 本文研究内容
    1.4 本文组织结构
第二章 相关理论与技术
    2.1 教育数据挖掘概述
    2.2 网络爬虫技术
        2.2.1 技术概述
        2.2.2 工作原理及基础架构
    2.3 Word Embedding技术
        2.3.1 词向量简介
        2.3.2 word2vec模型
    2.4 循环神经网络模型
        2.4.1 神经网络综述
        2.4.2 循环神经网络基本原理
    2.5 基于情感词典的分析方法
    2.6 本章小结
第三章 多源数据采集与数据处理
    3.1 引言
    3.2 高教社会评价数据多源采集
        3.2.1 百度知道数据采集
        3.2.2 网页新闻数据采集
        3.2.3 360 问答数据采集
        3.2.4 新浪微博数据采集
    3.3 高教社会评价数据预处理
    3.4 高教人才培养质量社会评价指标体系构建
        3.4.1 构建原则
        3.4.2 高教人才培养质量社会评价指标词典构建
        3.4.3 高教人才培养质量社会评价数据集筛选
    3.5 本章小结
第四章 基于改进情感词典的文本情感强度计算方法研究
    4.1 引言
    4.2 社交网络词典构建
    4.3 高教人才培养领域词典构建
    4.4 情感强度值计算方法
    4.5 实验结果与分析
        4.5.1 实验数据与指标
        4.5.2 实验结果对比分析
    4.6 本章小结
第五章 基于双向循环注意力神经网络的文本分类方法研究
    5.1 引言
    5.2 词向量模型
    5.3 基于双向循环注意力神经网络的文本分类模型
        5.3.1 文本表示层
        5.3.2 双向循环层
        5.3.3 注意力分配层
    5.4 文本分类器
    5.5 实验结果与分析
        5.5.1 实验数据与指标
        5.5.2 实验结果对比分析
    5.6 本章小结
第六章 原型系统的设计与实现
    6.1 引言
    6.2 系统分析与设计
        6.2.1 需求分析
        6.2.2 系统设计
        6.2.3 数据库设计
    6.3 系统实现
        6.3.1 系统运行环境
        6.3.2 数据可视化实现
    6.4 本章总结
第七章 总结与展望
    7.1 工作总结
    7.2 未来展望
参考文献
攻读硕士学位期间研究成果
致谢


【参考文献】:
期刊论文
[1]基于网络爬虫大数据的地方高校人才培养质量社会关注度挖掘[J]. 周世军,戴玉纯,洪旭东.  黑龙江高教研究. 2019(03)
[2]基于神经网络的文本表示模型新方法[J]. 曾谁飞,张笑燕,杜晓峰,陆天波.  通信学报. 2017(04)
[3]基于词向量模型的情感分析[J]. 魏广顺,吴开超.  计算机系统应用. 2017(03)
[4]改进的关联规则算法在学生成绩预警中的应用[J]. 王华,刘萍.  计算机工程与设计. 2015(03)
[5]从大数据挖掘的视角分析学生评教的有效性[J]. 马秀麟,衷克定,刘立超.  中国电化教育. 2014(10)
[6]基于统计的自动化Web新闻正文抽取[J]. 林子熠,沈备军.  计算机应用与软件. 2010(12)
[7]基于DOM的网页主题信息的抽取[J]. 刘军,张净.  计算机应用与软件. 2010(05)
[8]国外高校人才培养质量评估的初步研究[J]. 宋丁全,黄洋,王基林.  金陵科技学院学报(社会科学版). 2006(01)
[9]程度副词的特点范围与分类[J]. 蔺璜,郭姝慧.  山西大学学报(哲学社会科学版). 2003(02)

博士论文
[1]课程评论的情感倾向识别与话题挖掘技术研究[D]. 刘智.华中师范大学 2014
[2]高校学生能力素质模型构建及其应用研究[D]. 郑媖.武汉大学 2013

硕士论文
[1]基于深度学习的情感词向量及文本情感分析的研究[D]. 张志华.华东师范大学 2016
[2]基于语义技术的中文信息情感分析方法研究[D]. 林斌.哈尔滨工业大学 2006



本文编号:3703515

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3703515.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户83b45***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com