基于深度学习的新闻文本分类与应用
发布时间:2023-02-12 17:04
新闻文本信息是我们生活中接触较广泛的一种文本类信息,也是人们了解社会发展的重要手段之一。一方面,人们在进行新闻文本信息浏览,寻找感兴趣的新闻类别时,可能会掺杂其他类,用文本分类技术正确划分新闻类别,可节省用户获取信息的时间;另一方面,互联网公司可对新闻文本进行类别的划分,把不同类别放在不同类别库,根据用户需要进行自动化推荐,节省人力物力,提高效率。深度学习方法在自然语言处理领域的应用越来越广泛。本文利用深度学习的强大优势,将其应用在新闻文本分类领域,具体内容包括:(1)梳理了文本分类的基本流程,分析比较常用的文本分类算法,包括传统机器学习和深度学习算法。(2)针对传统机器学习算法特征工程繁琐的问题,包括文本预处理,文本表示,特征选择等步骤,这极大地增加了分类的工作量;本文提出了基于注意力机制的Text CNN深度学习模型。首先,选取Text CNN作为基础分类模型。然后,卷积层使用多尺度卷积核,池化层使用2-max pooling代替max pooling,同时增加平均池化。最后,在池化层后加入注意力机制,对2-max pooling和平均池化这两种池化得到的深层特征文本进行特征精炼,...
【文章页数】:63 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景和意义
1.2 国内外研究现状
1.2.1 文本分类研究现状
1.2.2 深度学习研究现状
1.3 研究内容
1.4 论文组织结构
1.5 本章小结
2 相关技术介绍
2.1 文本分类关键技术
2.1.1 文本预处理
2.1.2 文本表示
2.1.3 特征选择
2.1.4 分类算法
2.2 深度学习关键技术
2.2.1 卷积神经网络
2.2.2 循环神经网络
2.2.3 评价标准
2.2.4 深度学习框架
2.3 本章小结
3 基于注意力机制的CNN新闻文本分类模型
3.1 基于注意力机制的CNN新闻文本分类模型
3.1.1 注意力机制
3.1.2 算法框架
3.2 实验与分析
3.2.1 实验环境与数据集
3.2.2 实验设计及实现
3.2.3 实验结果及分析
3.3 本章小结
4 融合Attention-Text CNN和LSTM的新闻文本分类模型
4.1 融合Attention-Text CNN和LSTM的新闻文本分类模型
4.1.1 模型融合
4.1.2 算法框架
4.2 实验与分析
4.2.1 实验环境与数据集
4.2.2 实验设计及实现
4.2.3 实验结果及分析
4.3 本章小结
5 新闻文本分类系统设计与实现
5.1 需求分析
5.2 概要设计
5.3 详细设计
5.3.1 爬虫模块
5.3.2 文件上传模块
5.3.3 分类模块
5.4 新闻文本分类系统实现
5.4.1 系统开发环境
5.4.2 爬虫模块实现
5.4.3 文件上传模块实现
5.4.4 分类模块实现
5.5 本章小结
6 总结与展望
6.1 总结
6.2 展望
参考文献
致谢
本文编号:3741481
【文章页数】:63 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景和意义
1.2 国内外研究现状
1.2.1 文本分类研究现状
1.2.2 深度学习研究现状
1.3 研究内容
1.4 论文组织结构
1.5 本章小结
2 相关技术介绍
2.1 文本分类关键技术
2.1.1 文本预处理
2.1.2 文本表示
2.1.3 特征选择
2.1.4 分类算法
2.2 深度学习关键技术
2.2.1 卷积神经网络
2.2.2 循环神经网络
2.2.3 评价标准
2.2.4 深度学习框架
2.3 本章小结
3 基于注意力机制的CNN新闻文本分类模型
3.1 基于注意力机制的CNN新闻文本分类模型
3.1.1 注意力机制
3.1.2 算法框架
3.2 实验与分析
3.2.1 实验环境与数据集
3.2.2 实验设计及实现
3.2.3 实验结果及分析
3.3 本章小结
4 融合Attention-Text CNN和LSTM的新闻文本分类模型
4.1 融合Attention-Text CNN和LSTM的新闻文本分类模型
4.1.1 模型融合
4.1.2 算法框架
4.2 实验与分析
4.2.1 实验环境与数据集
4.2.2 实验设计及实现
4.2.3 实验结果及分析
4.3 本章小结
5 新闻文本分类系统设计与实现
5.1 需求分析
5.2 概要设计
5.3 详细设计
5.3.1 爬虫模块
5.3.2 文件上传模块
5.3.3 分类模块
5.4 新闻文本分类系统实现
5.4.1 系统开发环境
5.4.2 爬虫模块实现
5.4.3 文件上传模块实现
5.4.4 分类模块实现
5.5 本章小结
6 总结与展望
6.1 总结
6.2 展望
参考文献
致谢
本文编号:3741481
本文链接:https://www.wllwen.com/xinwenchuanbolunwen/3741481.html