基于LSTM-Attention的中文新闻标题分类研究
发布时间:2023-03-19 00:00
根据2018年8月中发布的《中国互联网络发展状况统计报告》显示,中国在2018年上半年的网民规模已经超过8亿水平,其中手机网民规模可占98%之多,这也意味着人们在移动互联网时代关于信息的获取偏好逐渐从传统互联网转向移动互联网,人们对移动终端的偏好也越来越强。而关于中国网民对于各类互联网应用的统计表明,有超过6.6亿近83%的中国网民在生活中会使用网络新闻类应用,其使用率高居所有应用类别的第二,仅次于即时通讯类应用。关于新闻行业的发展前景较为广阔,如何在移动互联网时代末期将网络新闻相关技术与人工智能等前沿技术结合,为用户呈现更好更有价值的内容,这是非常值得研究的一件事。新闻是人们对时事、最新行业相关消息了解的重要途径,而新闻的信息分类有助于实现新闻的有序化,对新闻文本进行挖掘,从而达到对决策提供引导。由于新闻分类本质上是一个文本分类问题,而且文本分类作为自然语言处理领域研究的一个重要方向,所以至今为止,人们对新闻文本分类已经有大量的研究。目前大部分文本分类问题都局限于使用常规的机器学习算法,所以对深度学习算法的研究应用还比较有限,所以本文旨在研究这个方面的问题。本文将新闻标题作为新闻分类...
【文章页数】:67 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
绪论
一、研究背景及意义
(一)研究背景
(二)研究意义
二、国内外研究现状
三、本文主要研究内容与创新点
四、本文整体结构
第一章 短文本分类相关技术
第一节 短文本分类流程介绍
一、文本分类流程
二、短文本预处理
三、词向量训练
第二节 分类算法相关模型介绍
一、朴素贝叶斯
二、卷积神经网络
三、循环神经网络
第三节 本章小结
第二章 中文新闻标题分类模型的构建
一、词向量模型的选择与训练
二、注意力机制模型
三、自注意模型介绍
四、基于自注意机制的组合短文本分类模型
五、本章小结
第三章 实验结果与对比分析
一、实验数据来源与环境介绍
二、实验数据采集
三、实验数据预处理
四、实验相关配置参数说明
五、分类效果评判指标说明
六、对比实验说明
七、实验结果分析
八、本章小结
总结与展望
一、本文工作总结
二、未来工作展望
参考文献
致谢
本文编号:3764128
【文章页数】:67 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
绪论
一、研究背景及意义
(一)研究背景
(二)研究意义
二、国内外研究现状
三、本文主要研究内容与创新点
四、本文整体结构
第一章 短文本分类相关技术
第一节 短文本分类流程介绍
一、文本分类流程
二、短文本预处理
三、词向量训练
第二节 分类算法相关模型介绍
一、朴素贝叶斯
二、卷积神经网络
三、循环神经网络
第三节 本章小结
第二章 中文新闻标题分类模型的构建
一、词向量模型的选择与训练
二、注意力机制模型
三、自注意模型介绍
四、基于自注意机制的组合短文本分类模型
五、本章小结
第三章 实验结果与对比分析
一、实验数据来源与环境介绍
二、实验数据采集
三、实验数据预处理
四、实验相关配置参数说明
五、分类效果评判指标说明
六、对比实验说明
七、实验结果分析
八、本章小结
总结与展望
一、本文工作总结
二、未来工作展望
参考文献
致谢
本文编号:3764128
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3764128.html
最近更新
教材专著