当前位置:主页 > 科技论文 > 软件论文 >

基于改进模糊语法增量式算法的文本分类方法

发布时间:2018-05-04 14:16

  本文选题:文本分类 + 机器学习 ; 参考:《计算机应用研究》2017年11期


【摘要】:针对现有很多文本分类算法必须进行训练—测试—再训练的缺点以及通用模型的语法表现度较差等问题,提出一种改进的模糊语法算法(IFGA)。根据一些选取的文本片段建立学习模型;为了适应轻微变化,采用增量式模型,将选取的文本片段转换到底层架构中,形成模糊语法;利用模糊联合操作将单个文本片段语法进行整合,并将所学习的文本片段转换成更加一般的表示形式。与决策表算法、改进的朴素贝叶斯算法等进行了两组对比实验,第一个实验结果表明,IFGA和其他机器学习算法性能并无明显差异;第二个实验结果说明,增量式学习算法比标准机器学习算法更加具有优势,其性能较平稳,数据的尺寸影响更小。提出的算法具有较低的模型重新训练时间。
[Abstract]:In view of the shortcomings of many existing text classification algorithms which must be trained, tested and retrained, as well as the poor grammatical representation of the general model, an improved fuzzy grammar algorithm (IFGAA) is proposed. The learning model is established according to some selected text fragments, and in order to adapt to slight changes, the incremental model is adopted to convert the selected text fragments to the underlying structure to form fuzzy syntax. A fuzzy joint operation is used to integrate the grammar of a single text fragment, and the learned text fragment is converted into a more general representation. Compared with the decision table algorithm and the improved naive Bayes algorithm, the first experiment shows that there is no significant difference between the performance of IFGA and other machine learning algorithms, and the second experiment shows that, The incremental learning algorithm has more advantages than the standard machine learning algorithm, its performance is stable, and the size of the data has less influence. The proposed algorithm has lower model re-training time.
【作者单位】: 湖南环境生物职业技术学院信息技术系;南华大学计算机学院;
【基金】:国家自然科学基金资助项目(61300234) 湖南省教育科技计划资助项目(13C243,12C1056)
【分类号】:TP391.1

【相似文献】

相关期刊论文 前10条

1 周桂芳;卢科;岳丽华;;一种基于日志的增量式编织机制[J];计算机工程;2012年01期

2 王秀,叶东毅;基于分布约简的获取规则的增量式方法[J];福州大学学报(自然科学版);2005年01期

3 林俊伟;叶东毅;;基于邻域辨识矩阵的属性约简增量式算法[J];计算机应用;2009年S1期

4 李斌,马戈,孙志挥;项目集发生变化的关联规则增量式更新算法[J];计算机应用;2004年12期

5 刘韶涛;余金山;王宁生;;一种迭代增量式的程序构建方法[J];辽宁工程技术大学学报;2005年06期

6 黄文芝 ,倪国元;基于模糊相似系数的增量式聚类算法[J];微型机与应用;2004年10期

7 罗维;;词语对齐的快速增量式训练方法研究[J];北京大学学报(自然科学版);2013年01期

8 刘宗田;属性最小约简的增量式算法[J];电子学报;1999年11期

9 王慧芳;黄林鹏;俞晟;;一种增量式的社区发现算法研究[J];计算机仿真;2008年01期

10 王彦如;;一增量式关联规则的改进算法[J];青海师范大学学报(自然科学版);2009年03期

相关会议论文 前10条

1 单莘;;一种网络告警的增量式情景规则挖掘方法[A];中国通信学会第五届学术年会论文集[C];2008年

2 王鑫;袁晓洁;李楠;;Native XML数据库的增量式验证[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年

3 程建军;陈晓云;马志新;;程序设计语言课程的增量式教学法改革与实践[A];2005全国计算机程序设计类课程教学研讨会论文集[C];2005年

4 陈恩红;张振亚;王煦法;;基于神经网络的增量式数据索引机制研究[A];2001年中国智能自动化会议论文集(上册)[C];2001年

5 陈克利;宗成庆;王霞;;基于大规模真实文本的平衡语料分析与文本分类方法[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年

6 姚天f ;彭思崴;;汉语主客观文本分类方法的研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

7 李月伦;李湘;常宝宝;袁毓林;;一种基于认知情景框架的文本分类方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年

8 张永;陈思睿;杨志勇;;一种改进的文本分类方法的研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年

9 栾江;唐常杰;黄晓冬;阴小雄;廖勇;;一种增量式支持向量机文本分类模型[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年

10 陈毅恒;秦兵;刘挺;林建国;李生;;基于错误预测的文本分类方法[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年

相关博士学位论文 前1条

1 陈春雷;面向GPGPU的并行增量式聚类算法研究[D];西北工业大学;2014年

相关硕士学位论文 前10条

1 唐琳;面向食品安全的在线新闻话题检测技术的研究与应用[D];中山大学;2015年

2 倪国元;基于模糊聚类的增量式挖掘算法研究[D];华中科技大学;2004年

3 张晶;增量式关联规则挖掘算法研究及其在飞行品质监控中的应用[D];中国民航大学;2008年

4 陈楠;基于粗集理论的增量式属性约简研究[D];长春理工大学;2005年

5 张长城;基于增量式低秩学习的视频目标跟踪[D];大连理工大学;2014年

6 郝允允;增量式数据竞争检测[D];中国科学技术大学;2009年

7 赖桃桃;增量式属性约简更新算法研究[D];厦门大学;2009年

8 周永锋;基于密度的海量数据增量式挖掘技术研究[D];中国人民解放军国防科学技术大学;2002年

9 涂明;关联规则增量式更新算法研究[D];合肥工业大学;2010年

10 段倩倩;面向大数据的增量式学习算法研究[D];山西财经大学;2015年



本文编号:1843281

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1843281.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户421cb***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com