基于人工智能技术Naive Bayes文本自动分类系统研究
发布时间:2021-01-04 00:03
随着信息时代的来临,特别是因特网对人们生活的全面介入,大量以文本格式存储的信息出现在Internet、数字图书馆及公司的Intranet上,如何从这些海量信息中快速、准确而全面地获取所需要的信息成为信息处理领域的研究热点。基于人工智能技术的文本自动分类成为研究解决这个问题的重要支撑技术之一。本文的目标就是在文本分类的背景下,从理论、算法改进和实现三个层次来讨论文本自动分类技术。 本文首先全面分析了当前文本自动分类领域关键技术和算法,同时阐述了典型文本自动分类系统的核心技术和系统结构,并对文本分类的应用范畴作了总结。 从统计学角度来看,传统的统计学文本分类算法尽管强大,但是它们总是基于很强的假设条件才成立,而实际应用中这些假设条件大多数情况下是不成立的,因此,它们所得到的结果尽管精确但却难以与实际应用较好地联系起来,亦即高精度的结果却导致丢失了很多文本固有的结构信息。本文深入研究了基于统计学的最为简单却强大的朴素贝叶斯(Na(?)ve Bayes)分类算法,从统计学角度研究了其应用前提-Na(?)ve Bayes假设,即所有文本特征向量元素服从独立同分布。实际上,文本上下文之...
【文章来源】:广东工业大学广东省
【文章页数】:81 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
目录
Contents
第一章 绪论
1.1 国内外相关研究概述
1.1.1 文本自动分类在国内外的发展
1.1.2 中文文本分类的发展与现状
1.2 文本分类概述
1.2.1 文本分类的定义
1.2.2 文本分类方法
1.2.3 文本分类的应用
1.3 文本分类的研究背景和意义
1.4 论文的组织结构
1.5 本章小结
第二章 文本分类关键技术
2.1 文本分类过程
2.1.1 文本信息的预处理
2.1.2 向量空间模型
2.1.3 空间降维
2.1.4 特征匹配和分类
2.2 文本分类算法
2.2.1 Rocchhio方法
2.2.2 简单向量距离分类法
2.2.3 贝叶斯方法(Na(?)ve Bayes)
2.2.4 K最近邻居方法(K Nearest Neighbor, KNN)
2.2.5 决策树方法
2.2.6 支持向量机(Support Vector Machine, SVM)
2.2.7 神经网络方法
2.3 本章小结
第三章 神经模糊系统
3.1 模糊逻辑
3.1.1 模糊集合(Fuzzy Sets)
3.1.2 模糊推理(Fuzzy Inference)
3.2 人工神经网络
3.2.1 人工神经网络的模型
3.2.2 多层感知器
3.3 神经模糊系统(Neuro-Fuzzy System)
3.3.1 神经模糊系统背景
3.3.2 神经模糊系统定义
3.3.3 神经模糊系统结构
3.3.4 神经模糊分类描述
3.3.5 神经模糊系统分类算法
3.4 本章小结
第四章 文本分类系统的设计
4.1 系统任务
4.2 系统结构
4.3 文本预处理
4.4 文本模糊表示
4.5 信息增益(Information Gain, IG)降维
4.6 Na(?)ve Bayes算法
4.6.1 贝叶斯理论
4.6.2 贝叶斯分类问题表述
4.6.3 贝叶斯分类器
4.6.4 贝叶斯模型特点
4.7 神经模糊系统优化Na(?)ve Bayes分类算法
4.7.1 贝叶斯分类器的神经模糊优化算法
4.7.2 优化算法实现问题
4.8 本章小结
第五章 文本分类系统的实现
5.1 软件结构
5.2 分类性能评估指标
5.3 实验数据及其分析
5.3.1 实验语料分析
5.3.2 实验结果及其分析
5.4 本章小结
课题总结与展望
一、论文小结
二、下一步的工作
参考文献
硕士期间已发表和录用的文章
独创性声明
致谢
本文编号:2955747
【文章来源】:广东工业大学广东省
【文章页数】:81 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
目录
Contents
第一章 绪论
1.1 国内外相关研究概述
1.1.1 文本自动分类在国内外的发展
1.1.2 中文文本分类的发展与现状
1.2 文本分类概述
1.2.1 文本分类的定义
1.2.2 文本分类方法
1.2.3 文本分类的应用
1.3 文本分类的研究背景和意义
1.4 论文的组织结构
1.5 本章小结
第二章 文本分类关键技术
2.1 文本分类过程
2.1.1 文本信息的预处理
2.1.2 向量空间模型
2.1.3 空间降维
2.1.4 特征匹配和分类
2.2 文本分类算法
2.2.1 Rocchhio方法
2.2.2 简单向量距离分类法
2.2.3 贝叶斯方法(Na(?)ve Bayes)
2.2.4 K最近邻居方法(K Nearest Neighbor, KNN)
2.2.5 决策树方法
2.2.6 支持向量机(Support Vector Machine, SVM)
2.2.7 神经网络方法
2.3 本章小结
第三章 神经模糊系统
3.1 模糊逻辑
3.1.1 模糊集合(Fuzzy Sets)
3.1.2 模糊推理(Fuzzy Inference)
3.2 人工神经网络
3.2.1 人工神经网络的模型
3.2.2 多层感知器
3.3 神经模糊系统(Neuro-Fuzzy System)
3.3.1 神经模糊系统背景
3.3.2 神经模糊系统定义
3.3.3 神经模糊系统结构
3.3.4 神经模糊分类描述
3.3.5 神经模糊系统分类算法
3.4 本章小结
第四章 文本分类系统的设计
4.1 系统任务
4.2 系统结构
4.3 文本预处理
4.4 文本模糊表示
4.5 信息增益(Information Gain, IG)降维
4.6 Na(?)ve Bayes算法
4.6.1 贝叶斯理论
4.6.2 贝叶斯分类问题表述
4.6.3 贝叶斯分类器
4.6.4 贝叶斯模型特点
4.7 神经模糊系统优化Na(?)ve Bayes分类算法
4.7.1 贝叶斯分类器的神经模糊优化算法
4.7.2 优化算法实现问题
4.8 本章小结
第五章 文本分类系统的实现
5.1 软件结构
5.2 分类性能评估指标
5.3 实验数据及其分析
5.3.1 实验语料分析
5.3.2 实验结果及其分析
5.4 本章小结
课题总结与展望
一、论文小结
二、下一步的工作
参考文献
硕士期间已发表和录用的文章
独创性声明
致谢
本文编号:2955747
本文链接:https://www.wllwen.com/kejilunwen/rengongzhinen/2955747.html