基于特征嵌入表示的文本分类方法研究

发布时间:2021-01-16 14:17
  计算机技术的发展加速了信息化时代的进程,同时也造成数据的指数型增长和数据处理工作量的增加。为了更高效地处理文本数据,自然语言处理及其相关研究被广泛关注。文本分类作为自然语言处理的子任务,在多个领域有着非常广泛的应用,如新闻分类、数字图书馆、情绪分析以及垃圾邮件过滤等。从目前的相关研究来看,在保证分类器能够充分训练的前提下,基于深度神经网络的文本分类方法已明显优于基于传统机器学习的文本分类方法。因此,深度神经网络的结构和应用将会是文本分类性能提升的重要途径和文本分类领域的主要研究方向。文本分类的效果不仅取决于分类器的设置,如何构造文本特征也尤为重要。对于离散的文本数据,构造特定的、可解释的语言模型来获取文本的嵌入表示,通过改进特征嵌入表示方法可以提高文本量化的质量,是间接提高分类器性能的有效方法。在文本分类领域中,现有的文本分类方法均通过结合文本量化方法和文本分类器取得了优异的性能,所以改进特征嵌入表示方法并将其与深度神经网络相结合是提高文本分类性能的有效方式。本文通过对文本分类应用和过程的分析,具体阐述了研究基于特征嵌入表示的文本分类方法的意义,具体研究内容如下:(1)提出一种结合动态... 

【文章来源】:山东师范大学山东省

【文章页数】:52 页

【学位级别】:硕士

【部分图文】:

基于特征嵌入表示的文本分类方法研究


不同词嵌入参数和语义


本文编号:2980977

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/2980977.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ccb5a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com