当前位置:主页 > 管理论文 > 统计学论文 >

端到端的属性级情感分析模型研究

发布时间:2024-07-05 05:25
  电子商务作为当下的一种新的购物和营销渠道,导致了互联网中各种服务和产品的评论数量激增。在这种情况下,属性级情感分析(Aspect Based Sentiment Analysis,ABSA)——即从文本中提取和总结有关特定实体及其属性的情感倾向,可以帮助消费者选择企业和产品,同时也可以帮助企业更好地监控其服务和产品的质量并快速了解市场需求。属性级情感分析旨在识别文本中提到的所有属性类别及其对应的情感极性,即属性类别检测子任务(Aspect-category Detection)和情感分类子任务(Sentiment Classification)。当前存在的绝大多数方法都分别对这两个子任务建立模型,尽管在两个子任务上目前都取得了优秀的实验结果,然而其提取的都是不完全的用户观点,并且上游的属性类别检测任务的准确性也会影响到下游的情感分类任务的效果,实用价值大大降低。此外,属性级情感分析任务需要的数据标注十分昂贵,导致可用数据极其稀少,也为属性级情感分析任务带来许多挑战。基于以上问题,本文提出了多种端到端的属性级情感分析模型,并通过引入预训练产生的词向量缓解数据稀少的问题。本文的研究内容归为...

【文章页数】:64 页

【学位级别】:硕士

【部分图文】:

图2-1中心词和其上下文词的示例

图2-1中心词和其上下文词的示例

哈尔滨工业大学应用统计硕士学位论文-9-图2-1中心词和其上下文词的示例Word2vec的核心思想就是已知存在一个很大的语料库,当我们用固定长度的窗口不断扫过语料库中的每一个句子时,我们得到位于窗口中间的中心词及其周边的上下文词,而他们的相似度可以用给定中心词的情况下上下文词的条....


图2-2窗口长度为2,中心词为“into”的上下文词的概率表示

图2-2窗口长度为2,中心词为“into”的上下文词的概率表示

哈尔滨工业大学应用统计硕士学位论文-9-图2-1中心词和其上下文词的示例Word2vec的核心思想就是已知存在一个很大的语料库,当我们用固定长度的窗口不断扫过语料库中的每一个句子时,我们得到位于窗口中间的中心词及其周边的上下文词,而他们的相似度可以用给定中心词的情况下上下文词的条....


图2-3窗口长度为2,中心词为“banking”的上下文词的概率表示

图2-3窗口长度为2,中心词为“banking”的上下文词的概率表示

哈尔滨工业大学应用统计硕士学位论文-9-图2-1中心词和其上下文词的示例Word2vec的核心思想就是已知存在一个很大的语料库,当我们用固定长度的窗口不断扫过语料库中的每一个句子时,我们得到位于窗口中间的中心词及其周边的上下文词,而他们的相似度可以用给定中心词的情况下上下文词的条....


图2-4fastText模型架构图

图2-4fastText模型架构图

妒垦?宦畚?-12-量表示。GloVe具有训练速度快的优点,并且在各项任务的性能比较中,不亚于word2vec的方法。2.1.4fastTextfastText是facebook公司在2016年开源的一款文本分类器。正如其名字一样,fastText的特点之一就是快,与其它文本分类....



本文编号:4001108

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/4001108.html

上一篇:耿奎:以统计专长为扶贫贡献重要力量  
下一篇:没有了

Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d448f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com