维吾尔文情感分析技术研究
发布时间:2022-11-05 08:55
随着互联网的发展,越来越多的用户主动加入到互联网创造了大量的数据,比如微博数据、论坛数据、电子商务网站的评论等数据都是用户主动创造的数据。这些数据的一个共同点就是大部分都带有用户针对某一个社会问题或者某件产品的态度和情感。分析这些带有用户情感的数据不仅有经济价值,还有社会价值。电商网站可以通过分析用户的评论数据了解用户的需求和产品的性能,从而改善产品质量和服务水平。政府部门通过分析网民的评论数据,可以快速了解社会热点问题和网民的对此的态度,从而做到有效的舆情分析和舆情监控。情感分析研究是在此环境下应运而生的。本文在前人工作的基础上,创建了维吾尔文情感语料库,并在此语料库基础上使用传统的机器学习算法和神经网络算法,找出了最适合进行维吾尔文情感分析的研究方法。虽然以前的学者们对维吾尔文情感分析进行了一定的研究,但是大部分从某一个角度进行了研究,没有对维吾尔文情感分析整个过程做一个对比实验。本文利用Python语言的Numpy,Pandas,Scipy,Matplotlib,BeautifulSoup,Tkinter,Scikitlearn,Gensim,Keras等库对维吾尔文情感分析进行...
【文章页数】:59 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 引言
1.1 研究背景及意义
1.2 情感分析技术的研究现状
1.2.1 英文和中文情感分析的研究现状
1.2.2 维吾尔文情感分析的研究现状
1.3 本文的主要工作和组织安排
第二章 情感语料库的构建
2.1 标注规范的制定
2.1.1 标注体系
2.1.2 标注集的选择
2.2 情感标注平台的设计
2.2.1 数据收集模块
2.2.2 数据标注模块
2.2.3 数据存储模块
2.3 情感语料库数据分析
2.4 本章小结
第三章 基于传统机器学习方法的文本情感分析
3.1 特征选择
3.1.1 基于文档频率的特征选择方法
3.1.2 基于信息增益的特征选择方法
3.1.3 基于CHI统计量的特征选择方法
3.1.4 基于互信息的特征选择方法
3.1.5 数据准备及性能指标
3.1.6 特征选择结果分析
3.2 传统的机器学习方法
3.2.1 基于朴素贝叶斯算法的情感分类方法
3.2.2 基于k-最近邻算法的情感分类方法
3.2.3 基于逻辑回归算法的情感分类方法
3.2.4 基于支持向量机算法的情感分类方法
3.2.5 基于随机森林算法的情感分类方法
3.3 本章小结
第四章 基于神经网络的文本情感分析
4.1 word2vec词向量与传统分类器的结合
4.2 基于卷积神经网络的文本情感分类
4.3 本章小结
第五章 总结与展望
参考文献
在读硕士研究生期间发表论文
致谢
本文编号:3702293
【文章页数】:59 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 引言
1.1 研究背景及意义
1.2 情感分析技术的研究现状
1.2.1 英文和中文情感分析的研究现状
1.2.2 维吾尔文情感分析的研究现状
1.3 本文的主要工作和组织安排
第二章 情感语料库的构建
2.1 标注规范的制定
2.1.1 标注体系
2.1.2 标注集的选择
2.2 情感标注平台的设计
2.2.1 数据收集模块
2.2.2 数据标注模块
2.2.3 数据存储模块
2.3 情感语料库数据分析
2.4 本章小结
第三章 基于传统机器学习方法的文本情感分析
3.1 特征选择
3.1.1 基于文档频率的特征选择方法
3.1.2 基于信息增益的特征选择方法
3.1.3 基于CHI统计量的特征选择方法
3.1.4 基于互信息的特征选择方法
3.1.5 数据准备及性能指标
3.1.6 特征选择结果分析
3.2 传统的机器学习方法
3.2.1 基于朴素贝叶斯算法的情感分类方法
3.2.2 基于k-最近邻算法的情感分类方法
3.2.3 基于逻辑回归算法的情感分类方法
3.2.4 基于支持向量机算法的情感分类方法
3.2.5 基于随机森林算法的情感分类方法
3.3 本章小结
第四章 基于神经网络的文本情感分析
4.1 word2vec词向量与传统分类器的结合
4.2 基于卷积神经网络的文本情感分类
4.3 本章小结
第五章 总结与展望
参考文献
在读硕士研究生期间发表论文
致谢
本文编号:3702293
本文链接:https://www.wllwen.com/jingjilunwen/dianzishangwulunwen/3702293.html