基于深度学习的文本分类方法研究
发布时间:2022-07-03 18:31
人工智能出现的意义是让机器自动的处理某些任务,希望处理结果能够达到人类水平或者超越人类水平。人工智能技术目前已经在教育,金融,医疗等多个领域实现技术落地,而且应用场景还在不断扩大。但是目前人工智能技术在很多方面仍存在些许不足。自然语言处理作为人工智能的一个子领域,目前仍然存在由于语言多样性,语义复杂性,导致机器不能充分理解人类语言这一重大难题,同时这也是业界众多学者共同面临的难题。本文针对自然语言处理方向中文文本分类这一细分领域中出现的语义理解不足,模型实际可用性不够好等问题进行了深入研究,研究成果如下:(1)针对现有常用模型处理实际特定领域文本情感分类准确度不高这一问题,同时考虑实际文本复杂情况,本文提出了一种优化算法。该方法基于经典算法模型BERT,优化了传统文本情感分类算法和主流文本情感分类算法。该算法采用3段式的学习方法,通过使用垂直领域数据进行增强学习,极大的增强了模型的语义情感理解效果。对比传统文本分类模型和主流文本分类模型,该算法的验证集准确度有较大的提升。最后将模型应用到实际生活中,完成了一个简单案例展示,最终取得了比较好的实际应用效果。(2)针对主流文本分类模型BER...
【文章页数】:58 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究背景
1.2 国内外研究现状
1.3 论文主要内容
1.4 论文组织结构
第二章 相关理论及技术介绍
2.1 Word2Vec模型介绍
2.1.1 模型概述
2.1.2 CBOW
2.1.3 Skip-gram
2.1.4 优化技巧
2.2 LSTM模型介绍
2.3 BERT模型介绍
2.4 XLNet模型介绍
2.5 迁移学习介绍
2.6 本章小结
第三章 基于BERT模型的文本情感分类方法优化
3.1 引言
3.2 文本情感分类的分析与研究
3.2.1 研究任务
3.2.2 任务分析
3.2.3 相关调研
3.3 算法框架
3.4 基于BERT模型的情感极性分析优化算法设计
3.4.1 传统文本情感分类算法分析
3.4.2 基于BERT模型的情感极性分析优化算法
3.4.3 基于BERT模型的情感极性分析优化算法的具体实现
3.5 实验详述
3.5.1 实验设计
3.5.2 实验数据
3.5.3 优化算法实验流程
3.5.4 基于Word2Vec和 LSTM模型的参数设置
3.5.5 基于BERT和 LSTM模型的参数设置
3.5.6 实验环境
3.5.7 评价指标
3.6 实验结果分析
3.7 案例展示
3.8 本章小结
第四章 基于XLNet模型的文本分类方法优化
4.1 引言
4.2 算法设计
4.2.1 XLNet模型
4.2.2 基于XLNet模型的文本分类优化算法
4.3 实验详述
4.3.1 实验设计
4.3.2 实验原始数据
4.3.3 实验流程
4.3.4 实验优化及问题处理
4.3.5 参数设置
4.3.6 评价指标
4.4 实验结果与分析
4.5 本章小结
第五章 总结与展望
5.1 总结
5.2 展望
参考文献
发表论文和科研情况说明
致谢
【参考文献】:
期刊论文
[1]基于NER的石油非结构化信息抽取研究[J]. 钟原,刘小溶,王杰,陈雁,张泰. 西南石油大学学报(自然科学版). 2020(06)
[2]基于BiLSTM-CRF的军事命名实体识别方法[J]. 高学攀,杜楚,吴金亮. 无线电工程. 2020(12)
[3]基于分层最大边缘相关的柬语多文档抽取式摘要方法[J]. 曾昭霖,严馨,余兵兵,周枫,徐广义. 河北科技大学学报. 2020(06)
[4]基于CNN-BGRU-CRF的中文电子病历实体抽取方法[J]. 冯云霞,衣鹏,韩正亮,宋波. 计算机与现代化. 2020(11)
[5]基于ELMO-CNN-BiLSTM-CRF模型的地质实体识别[J]. 储德平,万波,李红,方芳,王润. 地球科学. 2021(08)
[6]基于上下文相关字向量的中文命名实体识别[J]. 张栋,陈文亮. 计算机科学. 2021(03)
[7]无监督的句法可控复述模型用于对抗样本生成[J]. 杨二光,刘明童,张玉洁,孟遥,胡长建,徐金安,陈钰枫. 北京大学学报(自然科学版). 2021(01)
[8]一种基于改进逻辑回归算法实现模型在线调参方法[J]. 余韦,余凤丽,吉晶,杨猛. 通信技术. 2020(08)
[9]营销数据清洗及治理方法的研究及应用[J]. 梁卫宁,周钰书,唐文彬,刘森,陈玲娜. 信息技术与信息化. 2020(07)
[10]浅谈人工智能时代背景下自然语言处理技术的发展应用[J]. 赵园丁. 办公自动化. 2019(10)
博士论文
[1]基于深度模型的零样本迁移学习[D]. 宋杰.浙江大学 2020
硕士论文
[1]基于深度学习的智能问答系统研究[D]. 李敬鑫.电子科技大学 2020
[2]基于深度学习的文本分类问题研究[D]. 潘成龙.华中科技大学 2019
[3]基于GRU神经网络的时间序列预测研究[D]. 刘洋.成都理工大学 2017
[4]基于Attention-Based LSTM模型的文本分类技术的研究[D]. 张冲.南京大学 2016
本文编号:3655428
【文章页数】:58 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究背景
1.2 国内外研究现状
1.3 论文主要内容
1.4 论文组织结构
第二章 相关理论及技术介绍
2.1 Word2Vec模型介绍
2.1.1 模型概述
2.1.2 CBOW
2.1.3 Skip-gram
2.1.4 优化技巧
2.2 LSTM模型介绍
2.3 BERT模型介绍
2.4 XLNet模型介绍
2.5 迁移学习介绍
2.6 本章小结
第三章 基于BERT模型的文本情感分类方法优化
3.1 引言
3.2 文本情感分类的分析与研究
3.2.1 研究任务
3.2.2 任务分析
3.2.3 相关调研
3.3 算法框架
3.4 基于BERT模型的情感极性分析优化算法设计
3.4.1 传统文本情感分类算法分析
3.4.2 基于BERT模型的情感极性分析优化算法
3.4.3 基于BERT模型的情感极性分析优化算法的具体实现
3.5 实验详述
3.5.1 实验设计
3.5.2 实验数据
3.5.3 优化算法实验流程
3.5.4 基于Word2Vec和 LSTM模型的参数设置
3.5.5 基于BERT和 LSTM模型的参数设置
3.5.6 实验环境
3.5.7 评价指标
3.6 实验结果分析
3.7 案例展示
3.8 本章小结
第四章 基于XLNet模型的文本分类方法优化
4.1 引言
4.2 算法设计
4.2.1 XLNet模型
4.2.2 基于XLNet模型的文本分类优化算法
4.3 实验详述
4.3.1 实验设计
4.3.2 实验原始数据
4.3.3 实验流程
4.3.4 实验优化及问题处理
4.3.5 参数设置
4.3.6 评价指标
4.4 实验结果与分析
4.5 本章小结
第五章 总结与展望
5.1 总结
5.2 展望
参考文献
发表论文和科研情况说明
致谢
【参考文献】:
期刊论文
[1]基于NER的石油非结构化信息抽取研究[J]. 钟原,刘小溶,王杰,陈雁,张泰. 西南石油大学学报(自然科学版). 2020(06)
[2]基于BiLSTM-CRF的军事命名实体识别方法[J]. 高学攀,杜楚,吴金亮. 无线电工程. 2020(12)
[3]基于分层最大边缘相关的柬语多文档抽取式摘要方法[J]. 曾昭霖,严馨,余兵兵,周枫,徐广义. 河北科技大学学报. 2020(06)
[4]基于CNN-BGRU-CRF的中文电子病历实体抽取方法[J]. 冯云霞,衣鹏,韩正亮,宋波. 计算机与现代化. 2020(11)
[5]基于ELMO-CNN-BiLSTM-CRF模型的地质实体识别[J]. 储德平,万波,李红,方芳,王润. 地球科学. 2021(08)
[6]基于上下文相关字向量的中文命名实体识别[J]. 张栋,陈文亮. 计算机科学. 2021(03)
[7]无监督的句法可控复述模型用于对抗样本生成[J]. 杨二光,刘明童,张玉洁,孟遥,胡长建,徐金安,陈钰枫. 北京大学学报(自然科学版). 2021(01)
[8]一种基于改进逻辑回归算法实现模型在线调参方法[J]. 余韦,余凤丽,吉晶,杨猛. 通信技术. 2020(08)
[9]营销数据清洗及治理方法的研究及应用[J]. 梁卫宁,周钰书,唐文彬,刘森,陈玲娜. 信息技术与信息化. 2020(07)
[10]浅谈人工智能时代背景下自然语言处理技术的发展应用[J]. 赵园丁. 办公自动化. 2019(10)
博士论文
[1]基于深度模型的零样本迁移学习[D]. 宋杰.浙江大学 2020
硕士论文
[1]基于深度学习的智能问答系统研究[D]. 李敬鑫.电子科技大学 2020
[2]基于深度学习的文本分类问题研究[D]. 潘成龙.华中科技大学 2019
[3]基于GRU神经网络的时间序列预测研究[D]. 刘洋.成都理工大学 2017
[4]基于Attention-Based LSTM模型的文本分类技术的研究[D]. 张冲.南京大学 2016
本文编号:3655428
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3655428.html