文本分类系统设计与实现

发布时间:2017-09-14 04:22

  本文关键词:文本分类系统设计与实现


  更多相关文章: 文本分类 特征选择 微粒子群算法 混沌扰动模型 惯性权重


【摘要】:伴随着信息时代的到来,互联网迅速发展起来,大量文本信息也随之产生,丰富的信息背后蕴含着包括娱乐、农业、军事、经济等各领域的各种重要观点,巨大的价值亟待挖掘。因此如何更有效、更准确的对大量文本信息进行分析成为我们当前亟待研究的问题。文本分类方法的出现,帮助了人们更好更快地过滤垃圾信息、分析文本信息,从而将获取的信息利用于生活的方方面面。本文研究内容为该项目中的文本分类系统搭建部分,通过将经典的特征选择方法、自主设计的特征选择方法、经典的文本分类方法嵌入到系统中,从而建立一套通用的、可扩展的文本分类系统。使在文本分类各阶段算法的设计使用中,节约资源、避免重复开发,供上层应用模块灵活使用。本文完成的主要工作包括:(1)搭建可扩展、便于交互的文本分类研究系统,介绍并测试了系统的主要功能,验证本文改进方法的效果,为文本分类方法研究者提供了一个可视化、易使用的系统。(2)对文本分类的主要流程及其所应用到的方法进行介绍,并着重对特征选择方法以及文本分类方法的主要方法进行了对比分析。(3)针对系统的特征选择设计部分,本文提出一种基于改进微粒子群算法的特征选择方法(Feature Selection Based on Improved Particle Swarm Optimization Algorithm,简称FS-IPSO)。针对标准PSO算法的不足,在传统微粒子群算法基础上,通过扰动粒子初值、在迭代过程中随机扰动粒子位置,优化传统惯性权重三种方式,来避免粒子陷入局部最优,减少计算量,提高分类性能。
【关键词】:文本分类 特征选择 微粒子群算法 混沌扰动模型 惯性权重
【学位授予单位】:中山大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.1
【目录】:
  • 摘要4-5
  • ABSTRACT5-9
  • 第1章 绪论9-13
  • 1.1 项目研究背景与意义9-10
  • 1.2 国内外研究情况10-11
  • 1.3 论文主要工作11-12
  • 1.4 论文内容组织12-13
  • 第2章 文本分类系统及相关技术研究13-30
  • 2.1 文本分类13-14
  • 2.2 文本预处理14-17
  • 2.3 特征选择17-23
  • 2.4 特征权重计算23-25
  • 2.5 分类算法25-28
  • 2.6 文本分类系统28-30
  • 第3章 文本分类系统需求分析30-37
  • 3.1 系统目标和范围30-31
  • 3.2 系统功能需求31-35
  • 3.3 系统非功能需求35-36
  • 3.4 本章小结36-37
  • 第4章 系统模块总体设计37-53
  • 4.1 系统架构设计37-38
  • 4.2 表示模块38-39
  • 4.3 用户请求监听模块设计39-41
  • 4.4 业务逻辑模块设计41-51
  • 4.5 数据存储子系统51-52
  • 4.6 本章小结52-53
  • 第5章 系统详细设计与实现53-62
  • 5.1 用户请求监听子系统设计53-54
  • 5.2 文本分类子系统详细设计54-60
  • 5.3 数据存储子系统60-61
  • 5.4 本章小结61-62
  • 第6章 系统部署与应用62-74
  • 6.1 开发工具62
  • 6.2 系统功能展示62-67
  • 6.3 分类系统测试实验67-72
  • 6.4 本章小结72-74
  • 第7章 总结与展望74-76
  • 7.1 总结74-75
  • 7.2 展望75-76
  • 参考文献76-79
  • 致谢79-80

【相似文献】

中国期刊全文数据库 前10条

1 孙霞;郑庆华;;一种面向非平衡数据的邻居词特征选择方法[J];小型微型计算机系统;2008年12期

2 蒋盛益;郑琪;张倩生;;基于聚类的特征选择方法[J];电子学报;2008年S1期

3 王加龙;朱颢东;;结合类别相关性和辨识集的特征选择方法[J];微型机与应用;2009年23期

4 朱颢东;周姝;钟勇;;结合差别对象对集的综合性特征选择方法[J];计算机工程与设计;2010年03期

5 姜慧研;柴天佑;;基于可信间隔的特征选择方法研究[J];控制与决策;2011年08期

6 姚旭;王晓丹;张玉玺;权文;;特征选择方法综述[J];控制与决策;2012年02期

7 王志昊;王中卿;李寿山;李培峰;;不平衡情感分类中的特征选择方法研究[J];中文信息学报;2013年04期

8 张玉红;周全;胡学钢;;面向跨领域情感分类的特征选择方法[J];模式识别与人工智能;2013年11期

9 李敏;卡米力·木依丁;;特征选择方法与算法的研究[J];计算机技术与发展;2013年12期

10 申清明;闫利军;高建民;赵静;;基于混沌搜索的特征选择方法[J];兵工学报;2013年12期

中国重要会议论文全文数据库 前6条

1 徐燕;王斌;李锦涛;孙春明;;知识增益:文本分类中一种新的特征选择方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

2 肖婷;唐雁;;文本分类中特征选择方法及应用[A];2008年计算机应用技术交流会论文集[C];2008年

3 徐燕;孙春明;王斌;李锦涛;;基于词条频率的特征选择算法研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年

4 陈庆轩;郑德权;郑博文;赵铁军;李生;;中文文本分类中基于文档频度分布的特征选择方法[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年

5 顾成杰;张顺颐;刘凯;黄河;;基于粗糙集和禁忌搜索的特征选择方法[A];江苏省电子学会2010年学术年会论文集[C];2010年

6 王秀娟;郭军;郑康锋;;基于互信息可信度的特征选择方法[A];2006通信理论与技术新进展——第十一届全国青年通信学术会议论文集[C];2006年

中国博士学位论文全文数据库 前4条

1 刘明霞;属性学习若干重要问题的研究及应用[D];南京航空航天大学;2015年

2 毛勇;基于支持向量机的特征选择方法的研究与应用[D];浙江大学;2006年

3 尹留志;关于非平衡数据特征问题的研究[D];中国科学技术大学;2014年

4 裴志利;数据挖掘技术在文本分类和生物信息学中的应用[D];吉林大学;2008年

中国硕士学位论文全文数据库 前10条

1 曹晋;基于SVDD的特征选择方法研究及其应用[D];苏州大学;2015年

2 张强;静态图像上的行人检测方法研究[D];中国科学技术大学;2015年

3 张晓梅;基于融合特征的微博主客观分类方法研究[D];山西大学;2014年

4 王君;基于SVM-RFE的特征选择方法研究[D];大连理工大学;2015年

5 于海珠;面向文本聚类的特征选择方法及应用研究[D];大连理工大学;2015年

6 赵世琛;文本分类中特征选择方法研究[D];山西大学;2014年

7 王丹;特征选择算法研究及其在异常检测中的应用[D];电子科技大学;2014年

8 林艳峰;中文文本分类特征选择方法的研究与实现[D];西安电子科技大学;2014年

9 卢志浩;基于GEP的kNN算法改进研究[D];广西师范学院;2015年

10 王立鹏;面向图数据的特征选择方法及其应用研究[D];南京航空航天大学;2015年



本文编号:847847

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/847847.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户5e272***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com