基于遗传算法的模型参数选取及其在文本分类中的应用

发布时间:2022-10-11 16:55
  随着计算机技术的不断发展,信息数据大量增加,甚至呈指数级态势迅猛增长。有效利用这些信息数据的难度也随之增加。同时,在这些信息数据中还存在大量的无用信息以及有害信息,为处理信息的过程带来了极大的负面影响。因此,如何高效地利用信息数据,已经成为了机器学习领域的研究热点。此外,文本作为一种常见的信息数据形式,如何有效地对文本数据加以分类,则是文本信息处理过程中的重要任务。为了提高文本分类的快速性和准确性,针对分类效率及分类准确率的问题,本文采用了一种将遗传算法(GA)和支持向量机(SVM)相结合的文本分类方法。该方法将支持向量机的参数看作遗传算法的一个染色体,并进行二进制编码,将支持向量机的分类准确率用作遗传算法的适应度函数,对每一个个体适应度进行评价,并通过选择、交叉和变异的遗传操作,得到对文本分类数据最优的支持向量机参数,最后利用带有最优参数的支持向量机对属于既有类别的文本数据进行分类。一般情况下,对于新进的文本信息数据,我们可将其归入既有类别,然而既有类别往往无法满足大量新进的文本信息内容,即新进文本数据的类别往往会超出既有类别的范围。因此,如何有效地判断新进文本信息数据是否可以分类至... 

【文章页数】:63 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第1章 绪论
    1.1 研究背景
    1.2 研究目的与研究意义
    1.3 国内外研究现状
        1.3.1 国内研究现状
        1.3.2 国外研究现状
    1.4 本文的主要研究内容
第2章 文本分类的基本理论
    2.1 文本分类的基本流程
    2.2 文本预处理
        2.2.1 文本标记的预处理
        2.2.2 中文分词的预处理
        2.2.3 停用词的预处理
    2.3 文本表示
    2.4 特征处理
        2.4.1 特征提取
        2.4.2 特征加权
    2.5 评价指标
    2.6 小结
第3章 常用文本分类方法对比分析
    3.1 朴素贝叶斯算法
    3.2 K近邻算法
    3.3 支持向量机算法
        3.3.1 线性可分支持向量
        3.3.2 线性不可分支持向量
        3.3.3 多分类支持向量
        3.3.4 核函数
    3.4 文本分类算法对比
    3.5 小结
第4章 SVM参数优化方法的改进
    4.1 SVM参数
    4.2 SVM参数优化方法
        4.2.1 交叉验证法
        4.2.2 网格搜索法
    4.3 遗传算法优化SVM参数
        4.3.1 遗传算法
        4.3.2 遗传算法优化SVM参数
    4.4 小结
第5章 基于GA-SVM与 GA-FCM的渐进式分群模型
    5.1 GA-FCM算法
    5.2实验
        5.2.1 实验数据
        5.2.2 实验设计
        5.2.3 实验分析与实验结论
    5.3 小结
第6章 结论
参考文献
致谢


【参考文献】:
期刊论文
[1]基于支持向量机的文本分类[J]. 李芸初.  中国新技术新产品. 2019(01)
[2]Web文档分类中TFIDF特征选择算法的改进[J]. 段国仑,谢钧,郭蕾蕾,王晓莹.  计算机技术与发展. 2019(05)
[3]一种基于文本分类和评分机制的软件缺陷分配方法[J]. 史小婉,马于涛.  计算机科学. 2018(11)
[4]基于社交平台数据的文本分类算法研究[J]. 施瑞朗.  电子科技. 2018(10)
[5]基于贝叶斯决策的网格社区案卷分发模型[J]. 王鹤琴,王杨.  山东大学学报(理学版). 2018(11)
[6]基于搜索改进的KNN文本分类算法[J]. 殷亚博,杨文忠,杨慧婷,许超英.  计算机工程与设计. 2018(09)
[7]字符级卷积神经网络短文本分类算法[J]. 刘敬学,孟凡荣,周勇,刘兵.  计算机工程与应用. 2019(05)
[8]基于情感倾向和SVM混合极短文本分类模型[J]. 王鹤琴,王杨.  科技通报. 2018(08)
[9]支持向量机在文本分类中的研究与应用[J]. 张燕,姚志远,陈文社.  电脑编程技巧与维护. 2018(08)
[10]面向新闻文本的分类方法的比较研究[J]. 刘测,韩家新.  智能计算机与应用. 2018(05)

硕士论文
[1]基于机器学习的文本分类研究与实现[D]. 王振.南京邮电大学 2018
[2]基于社交媒体的灾害事件提取与时空分析[D]. 李想.兰州交通大学 2018
[3]基于卷积神经网络的文本分类器的设计与实现[D]. 白璐.北京交通大学 2018
[4]面向新闻领域的小型垂直搜索引擎[D]. 许翰林.南京信息工程大学 2018
[5]基于并行SVM算法的中文文本分类方法研究[D]. 尹旭东.吉林大学 2018
[6]基于AlphaGo设计思想的网络不良词汇发现模型研究[D]. 聂莉.华中师范大学 2018
[7]信息安全漏洞分类与评估技术研究[D]. 宋佳良.战略支援部队信息工程大学 2018
[8]基于集成学习的房产资讯分类[D]. 刘星灿.西南交通大学 2018
[9]面向淘宝的客户决策分析的研究与应用[D]. 陈家男.东北林业大学 2018
[10]基于新浪微博的短文本分类与个性化推荐[D]. 王娇.北京邮电大学 2018



本文编号:3690941

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3690941.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d53de***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com