基于文本和社交语境的微博数据情感分类
发布时间:2018-06-16 01:03
本文选题:情感分类 + 微博 ; 参考:《清华大学学报(自然科学版)》2014年10期
【摘要】:微博数据的情感分析具有重要的应用价值和研究价值,是网络文本挖掘领域的研究热点。微博消息非常短而且稀疏,同时包含大量的不规则词语,噪声很强,给传统的情感分析方法带来了很大的挑战。受社会科学的相关理论的启发,该文尝试利用微博消息的社交语境来帮助解决情感分析所面临的稀疏性强和噪声大的困难。由于文本向量的维度很高,而具有情感倾向的词只占其中较少的一部分,因此将Lasso方法加进LR(logistic regression)模型中以提高模型的鲁棒性。在真实的英文Twitter数据集上的实验结果表明,加入社交语境和模型的稀疏约束能够有效提高微博数据情感分类的准确率。
[Abstract]:The emotion analysis of micro blog data has important application value and research value . It is a hot topic in the field of network text mining . The microblog message is very short and sparse . It also contains a lot of irregular words . It has a strong noise .
【作者单位】: 清华大学电子工程系;
【基金】:国家“八六三”高技术项目(2012AA011004) 清华大学自主科研计划项目(20111081023)
【分类号】:TP393.092
,
本文编号:2024481
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2024481.html