当前位置:主页 > 科技论文 > 软件论文 >

基于主题模型的半监督网络文本情感分类研究

发布时间:2017-08-29 03:08

  本文关键词:基于主题模型的半监督网络文本情感分类研究


  更多相关文章: 情感分类 不平衡数据 半监督学习 主题模型


【摘要】:针对网络评论文本的情感分类问题中存在的数据的不平衡性、无标记性和不规范性问题,提出一种基于主题的闽值调整的半监督学习模型,通过从非结构化文本中提取主题特征,对少量标注情感的文本训练分类器并优化指标调整闽值,达到识别用户评论的情感倾向的目的。仿真研究证明阈值调整的半监督模型对数据非平衡性和无标记性具有较强的适应能力。在实证研究中,对酒店评论文本数据构建的文本情感分类器显示该模型可以有效预测少数类评论样本的情感极性,证实了基于主题模型的闽值调整半监督网络评论文本情感分类模型在实际问题中的适用性与可行性。
【作者单位】: 中国人民大学应用统计科学研究中心;中国人民大学统计学院;中国人民大学统计咨询研究中心;台北医学大学大数据研究中心;
【关键词】情感分类 不平衡数据 半监督学习 主题模型
【基金】:中国人民大学科学研究基金(中央高校基本科研业务费专项资金资助)项目(15XNI011)的阶段性成果
【分类号】:TP391.1
【正文快照】: 0引言 随着互联网技术的快速发展和网络文本信息的急剧膨胀,人们对从冗杂的网络信息中准确获取所需信息的需求日益增长。网络文本的情感分析技术通过自动分析产品、人物或事件 等的网络评论文本,发现消费者对其褒贬态度,已成为商务智能领域研究的新热点。现有研究表明,网络

本文编号:750972

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/750972.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e1f1f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com