基于多元融合神经网络的企业舆情分析技术研究与应用
发布时间:2022-12-17 08:36
企业舆情分析的目标是为用户提供企业在文本集合中的情感信息,了解目标企业在法律风险,新闻情感优劣,企业详情等方面的信息,从而使得用户可以准确掌握目标企业的画像。鉴于此,本文主要对企业舆情场景中的企业情感分析任务、新闻主题分类任务、企业信息抽取任务、开庭信息抽取任务进行研究,同时结合文本匹配技术,实现了各任务的应用过程。本文在企业情感分析技术研究的描述中,构建了一种多元融合神经网络模型(TFRCNN),它可以通过学习相应长度的句子语义信息,从而更好的解析文本中的企业情感倾向。模型中设计了一种采用特征融合提取和模型深度融合的结构。其中,特征融合提取结构使用注意力编码器和残差融合网络进行数据学习,通过多种特征融合的方式达到可以深入解析句子结构的目的;模型深度融合结构则通过构建3层RNN、CNN组合单元,从而提升了短句解析效果,最终提高了企业情感分析的准确度。本文在不同的情感分析数据集上的实验表明,该模型相比于结合注意力机制的卷积神经网络(CNN)和长短期记忆(LSTM)等模型而言,具有更好的效果。此外,本文还将TFRCNN模型应用于短文本文本匹配任务、实体信息抽取任务,实验表明此模型相对于对照...
【文章页数】:100 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究工作的背景与意义
1.2 国内外研究现状
1.2.1 中文命名实体识别研究现状
1.2.2 文本情感分析研究现状
1.2.3 文本主题分类研究现状
1.3 本文主要贡献和创新
1.4 本文的主要工作
1.5 论文的结构安排
第二章 相关原理与技术
2.1 统计语言模型
2.2 注意力机制
2.3 残差单元
2.4 位置编码(Position Embedding)
2.5 层归一化机制(Layer Normalization)
2.6 Stacking模型融合机制
2.6.1 数据K折交叉验证(K-Fold)机制
2.6.2 基模型
2.6.3 Stacking原理
2.7 TF-IDF算法
2.8 文本向量化策略
2.9 模型评价指标
2.10 本章小结
第三章 算法设计与实现
3.1 训练机硬件配置及相关问题
3.2 情感分析与新闻主题分类任务
3.2.1 粗细粒度模型构建方案选择
3.2.2 情感分析与新闻主题分类数据集构建
3.2.3 词典构建与词向量训练
3.2.4 情感分析模型构建(TFRCNN模型)
3.2.5 情感分析模型实验与结果
3.2.6 新闻主题分类模型训练集与模型构建
3.2.7 新闻主题分类模型实验与结果
3.3 中文实体信息抽取任务
3.3.1 文本信息抽取数据标注体系
3.3.2 文本信息抽取数据集构建
3.3.3 文本实体信息抽取模型构建
3.3.4 文本实体信息抽取实验与结果
3.4 文本排序任务
3.4.1 文本排序任务模型构建
3.4.2 文本排序任务数据集
3.4.3 文本排序任务模型实验与结果
3.5 本章小结
第四章 系统需求分析
4.1 总体需求分析
4.2 系统用例分析
4.3 系统功能需求分析
4.4 系统架构需求分析
4.5 本章小结
第五章 系统设计
5.1 系统通用架构设计
5.2 系统流程设计
5.3 系统功能设计
5.3.1 数据审核标注系统功能设计
5.3.2 企业舆情分析系统功能设计
5.4 系统数据库设计
5.4.1 数据库选择
5.4.2 数据审核标注系统数据库设计
5.4.3 企业舆情分析系统数据库设计
5.5 本章小结
第六章 系统实现与测试
6.1 开发技术选型
6.2 系统功能实现
6.2.1 企业舆情分析系统流程与功能展示
6.2.2 数据审核标注系统流程与功能展示
6.3 系统测试
6.3.1 系统功能测试
6.3.2 系统兼容性测试
6.4 本章小结
第七章 总结与展望
7.1 本文总结
7.2 后续工作展望
致谢
参考文献
攻读硕士研究生期的研究成果
【参考文献】:
期刊论文
[1]征信机构解决小微企业融资难问题的作用探析[J]. 陈洪辉. 征信. 2018(10)
[2]面向互联网评论情感分析的中文主观性自动判别方法研究[J]. 叶强,张紫琼,罗振雄. 信息系统学报. 2007(01)
本文编号:3719593
【文章页数】:100 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究工作的背景与意义
1.2 国内外研究现状
1.2.1 中文命名实体识别研究现状
1.2.2 文本情感分析研究现状
1.2.3 文本主题分类研究现状
1.3 本文主要贡献和创新
1.4 本文的主要工作
1.5 论文的结构安排
第二章 相关原理与技术
2.1 统计语言模型
2.2 注意力机制
2.3 残差单元
2.4 位置编码(Position Embedding)
2.5 层归一化机制(Layer Normalization)
2.6 Stacking模型融合机制
2.6.1 数据K折交叉验证(K-Fold)机制
2.6.2 基模型
2.6.3 Stacking原理
2.7 TF-IDF算法
2.8 文本向量化策略
2.9 模型评价指标
2.10 本章小结
第三章 算法设计与实现
3.1 训练机硬件配置及相关问题
3.2 情感分析与新闻主题分类任务
3.2.1 粗细粒度模型构建方案选择
3.2.2 情感分析与新闻主题分类数据集构建
3.2.3 词典构建与词向量训练
3.2.4 情感分析模型构建(TFRCNN模型)
3.2.5 情感分析模型实验与结果
3.2.6 新闻主题分类模型训练集与模型构建
3.2.7 新闻主题分类模型实验与结果
3.3 中文实体信息抽取任务
3.3.1 文本信息抽取数据标注体系
3.3.2 文本信息抽取数据集构建
3.3.3 文本实体信息抽取模型构建
3.3.4 文本实体信息抽取实验与结果
3.4 文本排序任务
3.4.1 文本排序任务模型构建
3.4.2 文本排序任务数据集
3.4.3 文本排序任务模型实验与结果
3.5 本章小结
第四章 系统需求分析
4.1 总体需求分析
4.2 系统用例分析
4.3 系统功能需求分析
4.4 系统架构需求分析
4.5 本章小结
第五章 系统设计
5.1 系统通用架构设计
5.2 系统流程设计
5.3 系统功能设计
5.3.1 数据审核标注系统功能设计
5.3.2 企业舆情分析系统功能设计
5.4 系统数据库设计
5.4.1 数据库选择
5.4.2 数据审核标注系统数据库设计
5.4.3 企业舆情分析系统数据库设计
5.5 本章小结
第六章 系统实现与测试
6.1 开发技术选型
6.2 系统功能实现
6.2.1 企业舆情分析系统流程与功能展示
6.2.2 数据审核标注系统流程与功能展示
6.3 系统测试
6.3.1 系统功能测试
6.3.2 系统兼容性测试
6.4 本章小结
第七章 总结与展望
7.1 本文总结
7.2 后续工作展望
致谢
参考文献
攻读硕士研究生期的研究成果
【参考文献】:
期刊论文
[1]征信机构解决小微企业融资难问题的作用探析[J]. 陈洪辉. 征信. 2018(10)
[2]面向互联网评论情感分析的中文主观性自动判别方法研究[J]. 叶强,张紫琼,罗振雄. 信息系统学报. 2007(01)
本文编号:3719593
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3719593.html
最近更新
教材专著