当前位置:主页 > 科技论文 > 搜索引擎论文 >

KNN和SVM算法在中文文本自动分类技术上的比较研究

发布时间:2018-06-13 20:39

  本文选题:中文文本分类 + KNN ; 参考:《河北农业大学学报》2008年03期


【摘要】:中文文本分类技术在中文信息智能处理方面具有十分重要的作用,比如:中文信息检索和搜索引擎等,KNN、贝叶斯、SVM等算法都可以应用到中文文本分类技术上,本研究分析和比较了KNN和SVM两种分类算法,并通过实验比较这两种算法对中文文本分类技术的效果。结果表明:SVM算法较优,是一种较好的中文文本分类算法。
[Abstract]:Chinese text classification technology plays an important role in the intelligent processing of Chinese information, such as: Chinese information retrieval and search engine, such as KNN, Bayesian SVM and other algorithms can be applied to Chinese text classification technology. In this study, two classification algorithms, KNN and SVM, are analyzed and compared, and the effects of these two algorithms on Chinese text classification are compared by experiments. The results show that: SVM algorithm is better, and it is a better Chinese text classification algorithm.
【作者单位】: 河北农业大学信息科学与技术学院;河北农业大学理学院;
【分类号】:TP391.1

【参考文献】

相关期刊论文 前2条

1 庞剑锋,卜东波,白硕;基于向量空间模型的文本自动分类系统的研究与实现[J];计算机应用研究;2001年09期

2 都云琪,肖诗斌;基于支持向量机的中文文本自动分类研究[J];计算机工程;2002年11期

【共引文献】

相关期刊论文 前10条

1 陶秀凤,唐诗忠,周鸣争;基于支持向量机的软测量模型及应用[J];安徽工程科技学院学报(自然科学版);2004年02期

2 徐正光,王淑盛,刘冀伟,王志良,史立峰;基于主成分分析的核Fisher判别方法在油水识别中的应用[J];北京科技大学学报;2005年01期

3 战守义,井新;加入时间因素的个性化信息过滤技术[J];北京理工大学学报;2005年09期

4 代劲;胡峰;王国胤;;基于不完备信息系统的文本分类研究与应用[J];重庆邮电学院学报(自然科学版);2006年03期

5 吴德会;王晓红;;基于SVM的传感器动态模型辩识方法[J];传感技术学报;2006年03期

6 常玉清,王福利,王小刚,吕哲;基于支持向量机的生物发酵过程软测量建模[J];东北大学学报(自然科学版);2005年11期

7 吕干云;程浩忠;郑金菊;汪晓东;;基于S变换和多级SVM的电能质量扰动检测识别[J];电工技术学报;2006年01期

8 宇缨;;支持向量机及其在自然语言处理中的应用[J];东莞理工学院学报;2007年01期

9 李粤;安捷;李星;;排序融合算法在校园网搜索引擎中的应用[J];大连理工大学学报;2005年S1期

10 李亚伟;陈守煜;韩小军;;基于支持向量机SVR的黄河凌汛预报方法[J];大连理工大学学报;2006年02期

相关会议论文 前10条

1 张艳宁;郑江滨;赵荣椿;;一种有效的遥感图像识别方法[A];第九届中国体视学与图像分析学术会议论文集[C];2001年

2 石培培;刘红英;;具有单个等式和界约束二次规划的新算法[A];中国运筹学会第八届学术交流会论文集[C];2006年

3 张东娜;彭宏;吴铁峰;;一种基于粗集与贝叶斯分类器的中文网页分类方法[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年

4 吕哲;常玉清;王福利;;生化过程软测量建模方法的研究[A];2006中国控制与决策学术年会论文集[C];2006年

5 颜根廷;马广富;朱良宽;宋斌;;一种鲁棒支持向量机算法[A];2006中国控制与决策学术年会论文集[C];2006年

6 王小刚;童振;王福利;张清知;;一种支持向量回归模型参数多目标寻优方法[A];2007中国控制与决策学术年会论文集[C];2007年

7 张娟;王慧锋;;文本分类技术在海量金融信息处理中的应用[A];第二十四届中国控制会议论文集(下册)[C];2005年

8 牛强;王志晓;陈岱;夏士雄;;基于支持向量机的Web文本分类方法[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年

9 沈体雁;夏帆;刘良明;王煌基;;基于MODIS数据的城市范围监测方法及其比较[A];新技术在土地调查中的应用与土地科学技术发展-2005年中国土地学会学术年会论文集[C];2005年

10 刘希玉;徐志敏;段会川;;基于支持向量机的创新分类器[A];山东省计算机学会2005年信息技术与信息化研讨会论文集(一)[C];2005年

相关博士学位论文 前10条

1 杨震;个性化信息获取方法的研究[D];大连理工大学;2004年

2 陆阳;二进神经网络规则提取方法研究[D];合肥工业大学;2002年

3 叶俊勇;人脸检测与识别方法研究[D];重庆大学;2002年

4 马笑潇;智能故障诊断中的机器学习新理论及其应用研究[D];重庆大学;2002年

5 夏建涛;基于机器学习的高维多光谱数据分类[D];西北工业大学;2002年

6 王亮申;图像特征提取及基于内容图像数据库检索理论和方法研究[D];大连理工大学;2002年

7 张燕平;基于商空间的构造性数据挖掘方法及应用[D];安徽大学;2003年

8 范昕炜;支持向量机算法的研究及其应用[D];浙江大学;2003年

9 吴涛;核函数的性质、方法及其在障碍检测中的应用[D];中国人民解放军国防科学技术大学;2003年

10 庾农;基于形态学理论的目标检测技术[D];中国人民解放军国防科学技术大学;2000年

相关硕士学位论文 前10条

1 杨盛;电子邮件过滤系统的研究与设计[D];中南大学;2005年

2 邱宇红;向量空间模型在医学文献相关性研究中的应用[D];中国医科大学;2006年

3 马安香;基于分类语义的Web信息抽取机制的研究与实现[D];东北大学;2005年

4 周钦强;基于人工智能技术Naive Bayes文本自动分类系统研究[D];广东工业大学;2005年

5 胡卓颖;专题型网页搜集器关键算法的研究及实现[D];江西师范大学;2005年

6 廖海波;基于投影寻踪回归的文本分类研究[D];江西师范大学;2005年

7 付雪峰;基于模糊—粗糙集的文本分类模型[D];江西师范大学;2005年

8 李威;基于向量空间的文本自动分类系统的研究和实现[D];兰州理工大学;2005年

9 姜绍君;与文本有关的说话人识别方法的研究[D];大连理工大学;2001年

10 忻栋;支持向量机算法的研究及在说话人识别上的应用[D];浙江大学;2002年

【二级参考文献】

相关期刊论文 前1条

1 黄萱菁,吴立德,石崎洋之,徐国伟;独立于语种的文本分类方法[J];中文信息学报;2000年06期

【相似文献】

相关期刊论文 前10条

1 马建斌;李滢;滕桂法;王芳;赵洋;;KNN和SVM算法在中文文本自动分类技术上的比较研究[J];河北农业大学学报;2008年03期

2 袁方,杨柳,张红霞;基于k-近邻方法的渐进式中文文本分类技术[J];华南理工大学学报(自然科学版);2004年S1期

3 代六玲,黄河燕,陈肇雄;中文文本分类中特征抽取方法的比较研究[J];中文信息学报;2004年01期

4 张野;杨建林;;基于KNN和SVM的中文文本自动分类研究[J];情报科学;2011年09期

5 钱铁云,王元珍,冯小年;结合类频率的关联中文文本分类[J];中文信息学报;2004年06期

6 李永平,程莉,叶卫国;基于隐含语义的kNN文本分类研究[J];计算机工程与应用;2004年06期

7 罗永莲,张永奎;基于混合特征的中文文本分类[J];电脑开发与应用;2005年04期

8 张海燕,陈治平,童调生;基于2-grams短语标引的关键词自动抽取[J];绍兴文理学院学报;2002年09期

9 吴雅娟,柳培林 ,丁子睿;基于统计分词的中文文本分类系统[J];电脑知识与技术;2005年11期

10 宋晓宇;孙业挺;孙焕良;;支持动态负载的移动对象最近邻查询算法[J];计算机工程与应用;2007年27期

相关会议论文 前10条

1 宋晓宇;孙业挺;孙焕良;;基于双层网格索引的移动对象KNN查询算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年

2 殷晓岚;丁治明;李京;;移动对象在空间网络数据库上的kNN查询[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年

3 魏萌芽;李翠平;陈红;;一种基于kNN的控制关系分析方法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年

4 刘玲;王冠;;可视化技术在分类算法中的应用研究[A];第四届中国智能计算大会论文集[C];2010年

5 张政;周水庚;周傲英;;一种新的基于kNN和Rocchio的文本分类方法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年

6 刘俊岭;孙焕良;;多维度量空间中发现相互kNN(英文)[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年

7 沈志斌;白清源;;基于加权修正的KNN文本分类算法[A];第二十五届中国数据库学术会议论文集(一)[C];2008年

8 谭立球;谷士文;夏胜平;;基于RSOM和KNN的图像内容检索[A];2007年全国开放式分布与并行计算机学术会议论文集(下册)[C];2007年

9 陈伟萍;王琳;封化民;杨鼎才;方勇;;一种基于语义概念的中文文本分类方法[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年

10 靖红芳;王斌;杨雅辉;;基于类别分布的特征选择框架[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

相关博士学位论文 前1条

1 周雪忠;文本挖掘在中医药中的若干应用研究[D];浙江大学;2004年

相关硕士学位论文 前10条

1 刘慧;基于KNN的中文文本分类算法研究[D];西南交通大学;2010年

2 鲁婷;K-近邻中文文本分类方法的研究[D];合肥工业大学;2010年

3 赵德圣;基于关联技术的中文文本分类研究[D];南京理工大学;2011年

4 何钟莉;中文文本分类关键技术研究与实现[D];西安电子科技大学;2009年

5 徐晓艳;基于K近邻算法的中文文本分类研究[D];安徽大学;2012年

6 陈冲;互联网中文文本分类的研究与应用[D];北京邮电大学;2011年

7 陈雅芳;中文文本分类方法研究[D];浙江大学;2010年

8 杜尔斌;基于改进KNN的文本分类算法的设计与实现[D];上海交通大学;2010年

9 吕万里;中文文本分类技术研究[D];山东科技大学;2010年

10 李保秀;中文文本分类技术研究[D];南昌大学;2010年



本文编号:2015340

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2015340.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3b491***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com