当前位置:主页 > 科技论文 > 自动化论文 >

基于深度学习的新闻实时分类服务系统的分析与设计

发布时间:2024-05-13 21:58
  当今处在互联网高度发展时期,各种信息以狂轰乱炸的形式扑面而来,而信息的载体大部分是文字的形式,如何从海量文本中获取有用的信息成为现代科技工作者研究的一个大的方向,也是自然语言处理领域研究的关键问题,从而推进了文本分类技术的高速发展。近几年,随着图像领域中深度学习的快速发展,人们也开始将深度学习引入到文本处理中,所以深度学习逐渐取代传统的机器学习方法成为文本分类领域的主流研究方法。因为深度学习以其独特的网络拓扑结构能够层层提取筛选出更多更好的文字特征信息,可以很好的解决当前文本分类所面临的瓶颈问题,本文就是依据深度学习的思想设计了一款对新闻文本进行实时分类的服务系统。首先,本文对文本分类的一般流程以及传统机器学习方法和深度学习方法在新闻文本分类中的区别进行陈述。采用字符级字向量进行文档特征的表示,该表示方法可有效解决离散式字向量表示得到的文档特征上下文文本语义丢失的问题。针对于新浪新闻语料库,采用三种神经网络算法(卷积神经网络、循环神经网络、fastText浅层神经网络)进行新闻分类实验效果的对比,并结合网络模型的结构,分析其各自在进行新闻文本分类时的优缺点。其次,本文在上述研究的基础上...

【文章页数】:67 页

【学位级别】:硕士

【部分图文】:

图1-1机器学习文本分类过程

图1-1机器学习文本分类过程

硕士学位论文基于深度学习的新闻实时分类服务系统的分析OOST[15])等。但这些分类器的效果还是严重依赖于之前的词向量特分布式词向量提出到现在,基于深度学习的文本分类模型已经展现强大的优势,在多种文本数据集上的实验结果都要优于传统的分类卷积神经网络CNN[16]还是长短记忆网....


图1-2深度学习文本分类过程

图1-2深度学习文本分类过程

硕士学位论文基于深度学习的新闻实时分类服务系统T[15])等。但这些分类器的效果还是严重依赖于之前的词向量式词向量提出到现在,基于深度学习的文本分类模型已经展大的优势,在多种文本数据集上的实验结果都要优于传统的积神经网络CNN[16]还是长短记忆网络LSTM[17]及其变体....


图2-1NNLM网络结构图

图2-1NNLM网络结构图

词、文档进行更本质的表达。这也是LSA的优点,可以在有限利用文本语义信息的同时,大大降低计算的代价,有效的提高了分析的效果。LSA非常依赖语料库的大小,对内容较多与篇幅较长的文本很适用。基于神经网络的词向量分布式表示法也称WordEmbedding(词嵌入),它是以n....


图2-2CBOW结构图

图2-2CBOW结构图

硕士学位论文基于深度学习的新闻实时分类服务系统的模型。word2vec的实现方法有两种形式,下面分别介绍续词袋模型(ContinuousBag-of-WordsModel,可记为CBOWp-gram)。WW的结构如图2-2所示,对比图2-1,可看出大概的网络结构....



本文编号:3972772

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3972772.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户92204***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com