当前位置:主页 > 科技论文 > 软件论文 >

文本分类中基于K-Sprinkling的特征提取方法

发布时间:2019-04-27 00:44
【摘要】:传统的特征提取方法大多注重类别对特征词的作用,不能很好地表达样本对类别的影响。为此,对样本的类别贡献问题进行研究。针对Sprinkling特征提取方法中未考虑样本对类别的贡献度问题,提出一种基于K-Sprinkling的特征提取方法。综合考虑样本紧密度和样本隶属度信息,利用Sprinkling方法的特点,将样本权值映射到语义空间中,实现对文本的分类。实验结果表明,K-Sprinkling方法比传统的Sprinkling方法在平衡样本分类上F1值提高了1.89%,在不平衡样本分类上F1值提高了3.30%,取得了较好的分类效果。
[Abstract]:Most of the traditional feature extraction methods pay attention to the effect of category on the feature words, and can not express the influence of samples on the category well. Therefore, this paper studies the category contribution of samples. In order to solve the problem of the contribution of samples to categories in Sprinkling feature extraction, a feature extraction method based on K-Sprinkling is proposed. Considering the compact density of samples and the membership information of samples, the weights of samples are mapped to semantic space by using the characteristics of Sprinkling method, and the text classification is realized. The experimental results show that the F1 value of the K-Sprinkling method is 1.89% higher than that of the traditional Sprinkling method, and the F1 value of the unbalanced sample classification is 3.30% higher than that of the traditional Sprinkling method.
【作者单位】: 东北林业大学信息与计算机工程学院;
【基金】:黑龙江省自然科学基金(F201201) 林业公益性行业科研专项(201504307)
【分类号】:TP391.1

【相似文献】

相关期刊论文 前10条

1 管聪慧,宣国荣;多类问题中的特征提取[J];计算机工程;2002年01期

2 朱玉莲;陈松灿;赵国安;;推广的矩阵模式特征提取方法及其在人脸识别中的应用[J];小型微型计算机系统;2007年04期

3 赵振勇;王保华;王力;崔磊;;人脸图像的特征提取[J];计算机技术与发展;2007年05期

4 冯海亮;王丽;李见为;;一种新的用于人脸识别的特征提取方法[J];计算机科学;2009年06期

5 陈伟;瞿晓;葛丁飞;;主观引导特征提取法在光谱识别中的应用[J];科技通报;2011年04期

6 王华,李介谷;人脸斜视图象的特征提取与恢复[J];上海交通大学学报;1997年01期

7 黄丽莉;皋军;;基于局部加权的非线性特征提取方法[J];华中科技大学学报(自然科学版);2013年S1期

8 徐f ,邱道尹,沈宪章;粮仓害虫的特征提取与分类的研究[J];郑州工业大学学报;2000年04期

9 马希荣,王行愚;西夏文字特征提取的研究[J];计算机工程与应用;2002年13期

10 王萍,王汉芝,岳斌,林孔元,刘还珠;一种大规模样本数据的特征提取方法[J];天津轻工业学院学报;2003年04期

相关会议论文 前10条

1 潘荣江;孟祥旭;杨承磊;王锐;;旋转体的几何特征提取方法[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年

2 薛燕;李建良;朱学芳;;人脸识别中特征提取的一种改进方法[A];第十三届全国图象图形学学术会议论文集[C];2006年

3 杜栓平;曹正良;;时间—频率域特征提取及其应用[A];2005年全国水声学学术会议论文集[C];2005年

4 黄先锋;韩传久;陈旭;周剑军;;运动目标的分割与特征提取[A];全国第二届信号处理与应用学术会议专刊[C];2008年

5 林土胜;赖声礼;;视网膜血管特征提取的拆支跟踪法[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年

6 杜栓平;丁烽;杨华;;基于小波系数聚类的特征提取器[A];中国声学学会2002年全国声学学术会议论文集[C];2002年

7 白真龙;霍强;;在联机手写中文识别中一种针对8方向特征提取的改进算法[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年

8 贾会强;刘晓丽;于洪志;;基于词性特征提取的藏文文本分类方法研究[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年

9 王茵;陈孝威;;基于层次特征提取及形态学的图像分割算法[A];第二届和谐人机环境联合学术会议(HHME2006)——第15届中国多媒体学术会议(NCMT'06)论文集[C];2006年

10 史广智;胡均川;;舰船螺旋桨叶片数识别研究[A];2005年全国水声学学术会议论文集[C];2005年

相关博士学位论文 前10条

1 易军;人脸识别中的特征提取与度量学习算法研究[D];北京邮电大学;2015年

2 陈超;复杂光照条件下的人脸识别方法研究[D];浙江大学;2016年

3 苗捷;时空特征提取方法研究[D];华南理工大学;2016年

4 谭文学;基于机器学习的作物病害图像处理及病变识别方法研究[D];北京工业大学;2016年

5 彭艺;面向可视化的特征提取、简化与追踪[D];清华大学;2015年

6 王胜;基于子空间的特征提取与融合算法研究[D];南京理工大学;2016年

7 杜建卫;希尔伯特黄变换方法及其在特征提取中的应用研究[D];北京科技大学;2017年

8 王振宇;面向人脸识别的特征提取技术应用研究[D];东南大学;2016年

9 游大涛;基于听觉机理的鲁棒特征提取及在说话人识别中的应用[D];哈尔滨工业大学;2013年

10 赵武锋;人脸识别中特征提取方法的研究[D];浙江大学;2009年

相关硕士学位论文 前10条

1 汤鹏;基于LDA的特征提取及其在人脸识别中的应用[D];河北大学;2015年

2 安磊磊;基于改进PCA和LDA的特征提取方法[D];河北大学;2015年

3 周雷;基于深度学习的人脸美丽预测研究[D];五邑大学;2015年

4 王婷婷;基于图像处理技术的古籍电子化研究[D];五邑大学;2015年

5 谢乃俊;低秩矩阵恢复在维数约简中的研究与应用[D];江西理工大学;2015年

6 端明亮;基于哼唱搜索的音乐检索系统研究[D];电子科技大学;2015年

7 陆浩;基于线状特征提取的机场目标识别技术[D];电子科技大学;2014年

8 刘奇;基于语义的恶意代码行为特征提取与分类技术研究[D];电子科技大学;2014年

9 杨培;基于改进特征提取的评论有效性分类模型[D];武汉纺织大学;2015年

10 张达明;基于局部特征提取的场景分类算法研究[D];电子科技大学;2015年



本文编号:2466537

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2466537.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c0e92***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com