基于深度学习的评论文本情感分析
发布时间:2020-06-23 17:13
【摘要】:当前文本表示模型较难捕获评论文本中结构词或短语的意义。同时深度情感分析模型忽略评论文本的层次结构,而直接将整个评论视为一个超长句子处理,且无法以可视化的方式评估其对情感词或句子的辨别能力。在许多现实场景中经常因数据集规模较小而不能满足深度神经网络模型训练的要求。同时现有深度情感分析模型一般都是单任务模型,未能有效利用不同任务间可共享的特征信息。为解决上述问题,首先设计一种能将评论文本结构信息引入深度情感分析模型的标志识别策略(Mark Recognition Strategy,MRS),并基于MRS提出一种分层标志模型(Hierarchical Mark Neural Model,HMN),该模型采用“词-句子-评论”的层次结构,使其不仅能够区分词的情感程度,还能辨别句子对整个评论情感的贡献程度。再通过引入词与句子级别的标志信息帮助模型处理带有复杂结构的评论文本,并能用可视化的方式评估模型HMN对情感词与句子的辨识能力。接着又提出一种基于模型HMN的迁移学习方法HMN-TF,该方法适用于模型HMN在小评论数据集上进行情感分析的场景,并针对模型的层次结构提出4种迁移参数微调(Fine-tuning)的策略。考虑到评论情感分析包括情感分类和观点摘要抽取等任务,为此提出一种基于HMN的多任务模型HMN-MT,该模型以训练并完成情感分类与观点摘要抽取任务的方式来提升表现。为评估MRS、HMN、HMN-TF和HMN-MT的有效性,在Amazon in Singapore、Test Freaks和Amazon Fine Food评论数据集上开展实验,并与评论文本情感分析的前沿模型在Accuracy与F1Score等指标上进行比较,其中模型HMN与最佳对比模型相比提升约1.6%,MRS最高可将深度神经网络模型的表现提升6.7%,HMN-TF在小评论数据集上Test Freaks的效果提升1.7%,模型HMN-MT的表现与前沿模型相比也有略微提升。
【学位授予单位】:华中科技大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.1;TP18
【图文】:
华 中 科 技 学 硕 学 位 论 但在 TestFreaks 数据集上,用 TriGrams 效果最好。实验结果还表明 LR 在不同的数据集下从时间复杂度和准确率上都远远优于 NB。
图 5-4 HMN 准确率评估的表现比当前主流的机器学习与深度学习模型都优秀,并且数据集规模对深度情感分析模型有非常大影响,HMN 在数据集规模较小时难以将表现调到最佳。表格 5-6 HMN 准确率数据集 对比算法评估指标Accuracy F1ScoreTestFBidLSTM 0.8151 0.8082TextCNN 0.8509 0.8500BidLSTM-AM 0.8629 0.8623HMN 0.8858 0.8746AmazonSBidLSTM 0.8867 0.8793TextCNN 0.9237 0.9187
本文编号:2727653
【学位授予单位】:华中科技大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.1;TP18
【图文】:
华 中 科 技 学 硕 学 位 论 但在 TestFreaks 数据集上,用 TriGrams 效果最好。实验结果还表明 LR 在不同的数据集下从时间复杂度和准确率上都远远优于 NB。
图 5-4 HMN 准确率评估的表现比当前主流的机器学习与深度学习模型都优秀,并且数据集规模对深度情感分析模型有非常大影响,HMN 在数据集规模较小时难以将表现调到最佳。表格 5-6 HMN 准确率数据集 对比算法评估指标Accuracy F1ScoreTestFBidLSTM 0.8151 0.8082TextCNN 0.8509 0.8500BidLSTM-AM 0.8629 0.8623HMN 0.8858 0.8746AmazonSBidLSTM 0.8867 0.8793TextCNN 0.9237 0.9187
【参考文献】
相关硕士学位论文 前2条
1 陆宇杰;中文微博情感分析及其应用[D];华东师范大学;2013年
2 刘洪君;微博网络热点话题发现技术研究[D];北京交通大学;2013年
本文编号:2727653
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2727653.html