当前位置:主页 > 科技论文 > 软件论文 >

改进信息增益的维吾尔文特征选择方法

发布时间:2021-08-17 03:58
  特征选择是维吾尔语文本分类的关键技术,对分类结果将产生直接的影响。为了提高传统信息增益在维吾尔文特征选择中的效果,在深度分析维吾尔文语种特点的基础上,提出了一种新的信息增益特征选择方法。该方法结合类词频和特征分布系数以及倒逆文档频率,对传统信息增益进行修正;引入一个备选特征分布系数来平衡类间选取的特征个数;在维吾尔文数据集上实验验证。实验结果表明,改进的算法对维吾尔文分类效果有明显的提高。 

【文章来源】:计算机工程与应用. 2017,53(23)北大核心CSCD

【文章页数】:5 页

【文章目录】:
1 引言
2 维吾尔文语种特点和预处理
3 信息增益特征选择方法
4 传统信息增益的不足及改进
    4.1 针对特征项区分度的改进
    4.2 针对类词频的改进
    4.3 针对数据集不均匀的改进
    4.4 针对备选特征项类别分布的改进
5 实验与分析
    5.1 数据集
    5.2 分类器
    5.3 分类性能评估
    5.4 实验数据与分析
6 结束语


【参考文献】:
期刊论文
[1]基于词频分布信息的优化IG特征选择方法[J]. 刘海峰,刘守生,宋阿羚.  计算机工程与应用. 2017(04)
[2]基于词频信息的改进信息增益文本特征选择算法[J]. 石慧,贾代平,苗培.  计算机应用. 2014(11)
[3]基于词频的优化互信息文本特征选择方法[J]. 刘海峰,姚泽清,苏展.  计算机工程. 2014(07)
[4]基于加权改进贝叶斯算法的维吾尔文文本分类[J]. 陈洋,哈力旦·阿布都热依木,伊力亚尔·达吾提,亚力青·阿里玛斯.  计算机工程与设计. 2014(06)
[5]面向维吾尔文不平衡数据分类的特征选择方法[J]. 董瑞,周喜.  计算机工程与设计. 2013(01)
[6]基于短语的维吾尔文文本分类[J]. 阿力木江·艾沙,吐尔根·依布拉音,库尔班·吾布力,李哲.  计算机应用. 2012(10)
[7]文本分类中的特征降维方法研究[J]. 张玉芳,万斌候,熊忠阳.  计算机应用研究. 2012(07)
[8]基于改进的ID3信息增益的特征选择方法[J]. 朱颢东,钟勇.  计算机工程. 2010(08)



本文编号:3347012

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3347012.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3d50c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com