基于深度学习的情感分类和联合实体关系抽取实证研究
发布时间:2025-02-05 12:21
随着“互联网+旅游”的快速发展,我国在线预订酒店规模迅速扩大。消费者能够在酒店预订平台上发表自己的体验和评价,成为用户做出预订决策和酒店管理人员做出管理决策、评估自身服务质量以及挖掘消费者需求的重要途径。在酒店评论中,包含消费者对酒店服务质量评价的情感倾向,以及对具体评价对象的一个评价。对这些文本进行分析、处理、归纳和总结,对用户分析、市场调查以及探索影响酒店服务质量影响因素有重要参考意义。本文对从携程上收集的88家酒店,共104740条评论,进行情感分类和实体关系抽取,对文本进行情感分类,并抽取其中的评价对象和评价词及其对应关系。对情感分类模型的构建,本文通过人工对评论进行情感标注,分为正面情感和负面情感,其中正负样本比例为9:1,利用Focal Loss代替交叉熵作为情感分类模型的损失函数,该损失函数能够降低简单样本的权重,关注困难样本的训练。本文构建了三个不同网络结构的模型,TextCNN扩展模型、混合神经网络模型以及FastText模型进行集成学习,在单个模型中FastText模型表现最好,F值为0.8587,通过集成学习能够将F值提高至0.9003,AUC...
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
本文编号:4029827
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
图1-1研究框架图
11第五章总结与展望。本章节对本文的研究内容、方法和研究结果进行总结。并阐述未来的工作研究方向。本文的研究框架图如图1-1所示:图1-1研究框架图1.4研究难点与可能的贡献1.4.1研究难点(1)标注语料获取难度大获取评论语料是展开研究的关键。携程携程作为一个商业网站,其网站上的....
图2-1卷积神经网络结构
13第2章情感分类及联合实体关系抽取理论基础2.1情感分类模型2.1.1Text<sub>C</sub>NN模型Text<sub>C</sub>NN模型是Kim(2014)提出的模型,首次将卷积神经网络模型应用在文本分类领域,利用不同size的kernel来识别句子中的信息,能够....
图2-2分层Softmax结构
17FastText由输入层、隐含层、输出层构成。输入层是由向量表示的单词,隐藏层是词向量的平均,输出层映射到所有类别中。FastText模型的输入是多个单词及其N-gram特征。Fasttext在输入时使用字符级别的N-gram向量作为附加特征,使得语义特征更加完整,并采用分层....
图2-3集成学习模型
19),...,,,(321nxxxxX),...,,,(321nyyyyY图2-3集成学习模型2.2联合实体关系抽取2.2.1序列标注实体识别是信息抽取关键任务,是指从文本序列中识别出有特定意义或者指代性强的实体,包括人名、地名、组织结构名、名词等,本文中实体特指评价对象和评价....
本文编号:4029827
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/4029827.html
最近更新
教材专著