基于集成多分类器系统的文本情感分类模型
发布时间:2021-01-19 16:30
随着互联网技术的快速发展,越来越多的人们喜欢在网络上表达他们的观点。人们在网络上发表的文本内容大多包含一定的情感倾向且具有潜在的商业和社会价值,针对这类网络文本的情感分类研究也随之出现。本文的研究内容为文本的情感二分类。针对这个任务,本文在一个基于MCS(Multiple Classifier Systems)的分类模型的基础上,提出一种基于集成多分类器系统的文本情感分类模型。该模型包含三个多分类器系统,它们的组合策略为多数投票法。考虑到区别特征选择器在特征选择上的缺陷,提出一种基于类别区分度的区别特征选择器。本文的研究内容分别从优化分类模型和优化特征选择两个方面去提高文本情感分类的分类准确度。本文详细的研究内容概括如下:(1)提出一种基于集成多分类器系统的文本情感分类模型。不同于传统的集成学习模型使用单分类器作为集成模型的个体分类器,本文提出的文本情感分类模型使用三个多分类器系统作为总模型的个体分类器,并且这三个个体分类器是异质的。第一个多分类器系统使用的个体分类器是支撑向量机分类器,使用袋装法作为多个个体分类器的集成方法。第二个多分类器系统使用的个体分类器也为支撑向量机分类器,使用...
【文章来源】:湖南大学湖南省 211工程院校 985工程院校 教育部直属院校
【文章页数】:73 页
【学位级别】:硕士
【部分图文】:
文本分类流程
向量空间模型文本表示示意图
集成学习的一般结构
【参考文献】:
期刊论文
[1]基于Bagging集成学习算法的地震事件性质识别分类[J]. 任涛,林梦楠,陈宏峰,王冉冉,李松威,刘晓雨,刘杰. 地球物理学报. 2019(01)
[2]集成学习方法研究[J]. 周钢,郭福亮. 计算技术与自动化. 2018(04)
[3]房价预测机器学习之集成学习[J]. 励嘉豪,曾丹. 电子技术与软件工程. 2018(20)
[4]基于情感倾向和SVM混合极短文本分类模型[J]. 王鹤琴,王杨. 科技通报. 2018(08)
[5]基于微博情感分析和社会网络分析的雾霾舆情研究[J]. 何跃,朱婷婷. 情报科学. 2018(07)
[6]文本特征提取方法研究综述[J]. 徐冠华,赵景秀,杨红亚,刘爽. 软件导刊. 2018(05)
[7]基于概率模型的非均匀数据聚类算法[J]. 杨天鹏,陈黎飞. 计算机应用. 2018(10)
[8]基于集成学习的口令强度评估模型[J]. 宋创创,方勇,黄诚,刘亮. 计算机应用. 2018(05)
[9]基于Bagging策略的XGBoost算法在商品购买预测中的应用[J]. 谢冬青,周成骥. 现代信息科技. 2017(06)
[10]混合CHI和MI的改进文本特征选择方法[J]. 王振,邱晓晖. 计算机技术与发展. 2018(04)
本文编号:2987328
【文章来源】:湖南大学湖南省 211工程院校 985工程院校 教育部直属院校
【文章页数】:73 页
【学位级别】:硕士
【部分图文】:
文本分类流程
向量空间模型文本表示示意图
集成学习的一般结构
【参考文献】:
期刊论文
[1]基于Bagging集成学习算法的地震事件性质识别分类[J]. 任涛,林梦楠,陈宏峰,王冉冉,李松威,刘晓雨,刘杰. 地球物理学报. 2019(01)
[2]集成学习方法研究[J]. 周钢,郭福亮. 计算技术与自动化. 2018(04)
[3]房价预测机器学习之集成学习[J]. 励嘉豪,曾丹. 电子技术与软件工程. 2018(20)
[4]基于情感倾向和SVM混合极短文本分类模型[J]. 王鹤琴,王杨. 科技通报. 2018(08)
[5]基于微博情感分析和社会网络分析的雾霾舆情研究[J]. 何跃,朱婷婷. 情报科学. 2018(07)
[6]文本特征提取方法研究综述[J]. 徐冠华,赵景秀,杨红亚,刘爽. 软件导刊. 2018(05)
[7]基于概率模型的非均匀数据聚类算法[J]. 杨天鹏,陈黎飞. 计算机应用. 2018(10)
[8]基于集成学习的口令强度评估模型[J]. 宋创创,方勇,黄诚,刘亮. 计算机应用. 2018(05)
[9]基于Bagging策略的XGBoost算法在商品购买预测中的应用[J]. 谢冬青,周成骥. 现代信息科技. 2017(06)
[10]混合CHI和MI的改进文本特征选择方法[J]. 王振,邱晓晖. 计算机技术与发展. 2018(04)
本文编号:2987328
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/2987328.html
最近更新
教材专著