当前位置:主页 > 社科论文 > 新闻传播论文 >

基于深度学习的新闻文本分类与应用

发布时间:2023-02-12 17:04
  新闻文本信息是我们生活中接触较广泛的一种文本类信息,也是人们了解社会发展的重要手段之一。一方面,人们在进行新闻文本信息浏览,寻找感兴趣的新闻类别时,可能会掺杂其他类,用文本分类技术正确划分新闻类别,可节省用户获取信息的时间;另一方面,互联网公司可对新闻文本进行类别的划分,把不同类别放在不同类别库,根据用户需要进行自动化推荐,节省人力物力,提高效率。深度学习方法在自然语言处理领域的应用越来越广泛。本文利用深度学习的强大优势,将其应用在新闻文本分类领域,具体内容包括:(1)梳理了文本分类的基本流程,分析比较常用的文本分类算法,包括传统机器学习和深度学习算法。(2)针对传统机器学习算法特征工程繁琐的问题,包括文本预处理,文本表示,特征选择等步骤,这极大地增加了分类的工作量;本文提出了基于注意力机制的Text CNN深度学习模型。首先,选取Text CNN作为基础分类模型。然后,卷积层使用多尺度卷积核,池化层使用2-max pooling代替max pooling,同时增加平均池化。最后,在池化层后加入注意力机制,对2-max pooling和平均池化这两种池化得到的深层特征文本进行特征精炼,...

【文章页数】:63 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
1 绪论
    1.1 研究背景和意义
    1.2 国内外研究现状
        1.2.1 文本分类研究现状
        1.2.2 深度学习研究现状
    1.3 研究内容
    1.4 论文组织结构
    1.5 本章小结
2 相关技术介绍
    2.1 文本分类关键技术
        2.1.1 文本预处理
        2.1.2 文本表示
        2.1.3 特征选择
        2.1.4 分类算法
    2.2 深度学习关键技术
        2.2.1 卷积神经网络
        2.2.2 循环神经网络
        2.2.3 评价标准
        2.2.4 深度学习框架
    2.3 本章小结
3 基于注意力机制的CNN新闻文本分类模型
    3.1 基于注意力机制的CNN新闻文本分类模型
        3.1.1 注意力机制
        3.1.2 算法框架
    3.2 实验与分析
        3.2.1 实验环境与数据集
        3.2.2 实验设计及实现
        3.2.3 实验结果及分析
    3.3 本章小结
4 融合Attention-Text CNN和LSTM的新闻文本分类模型
    4.1 融合Attention-Text CNN和LSTM的新闻文本分类模型
        4.1.1 模型融合
        4.1.2 算法框架
    4.2 实验与分析
        4.2.1 实验环境与数据集
        4.2.2 实验设计及实现
        4.2.3 实验结果及分析
    4.3 本章小结
5 新闻文本分类系统设计与实现
    5.1 需求分析
    5.2 概要设计
    5.3 详细设计
        5.3.1 爬虫模块
        5.3.2 文件上传模块
        5.3.3 分类模块
    5.4 新闻文本分类系统实现
        5.4.1 系统开发环境
        5.4.2 爬虫模块实现
        5.4.3 文件上传模块实现
        5.4.4 分类模块实现
    5.5 本章小结
6 总结与展望
    6.1 总结
    6.2 展望
参考文献
致谢



本文编号:3741481

资料下载
论文发表

本文链接:https://www.wllwen.com/xinwenchuanbolunwen/3741481.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户abfb9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com