融合特征权重计算方法的短文本技术研究

发布时间:2024-04-03 01:39
  文本分类是自然语言处理(NLP)应用中的基本任务之一。卷积神经网络(CNN)广泛用于NLP任务。然而,应用卷积神经网络进行文本分类忽略了文本分类类别中词语的区分能力。特征权重计算方法广泛用于数据检索和文本分类模型。最近,有研究者提出了一种有监督的特征权重计算方法,用来选择文本中对文本分类类别具有高区分能力的那些词。为了改进基于CNN的文本分类,我们引入了一种特征权重计算方法来改进基于CNN的文本分类。具体说来,我们使用两个单独的模型来进行文本分类任务。一种是使用特征权重计算方法来选择具有高类别区分度的单词,然后使用它们来表示文本。另一个是使用卷积神网络从新文本表示中提取特征并进行分类。我们在数据集Reuters-21578上进行了文本分类的实验。通过使用这种方法,我们提高了句子的准确性。

【文章页数】:55 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
Chapter01 Introduction
    1.1 Research Background
    1.2 Research significance
    1.3 Research Goals
    1.4 My Contribution
    1.5 Thesis Outline
Chapter02 Related Work
    2.1 Text Classification
        2.1.1 Background of Text Classification
        2.1.2 Text Classification Algorithms
            2.1.2.1 Bayes Na?ve Algorithm
            2.1.2.2 Support Vector Machines
    2.2 Term Weighting Schemes
        2.2.1 Unsupervised Schemes
        2.2.2 Supervised Schemes
    2.3 Neural Network
        2.3.1 Back ground of Neural Network
        2.3.2 Convolutional Neural Network
            2.3.2.1 Background of Convolutional Neural Network
            2.3.2.2 Convolution
            2.3.2.3 Pooling
Chapter03 Methods and Experiments
    3.1 Model Description
        3.1.1 Distributional Concentration and Balanced Distributional Concentration
            3.1.1.1 Distributional Concentration
            3.1.1.2 Balanced Distributional Concentration
        3.1.2 Combining Balanced Distributional Concentration into Convolutional Neural Networks
    3.2 Experiments
        3.2.1 Datasets
        3.2.2 Experimental Settings
        3.2.3 Experimental Results
Chapter04 Conclusion and Future Work
References
Acknowledgement
附件



本文编号:3946517

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3946517.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户6bfdd***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com