基于改进贝叶斯算法的中文信息分类研究
【文章页数】:85 页
【学位级别】:硕士
【部分图文】:
图1一1单一模型方法具体内容
Learning?Weighted?Naive?研究如何从数据中学习具有因排Bayes?with?Accurate?精确排序的加权朴素贝叶?耗时Ranking?斯,提出了一种利用增益比??计算特征权重的方法1411??贝叶斯分类研究现状??算法作为一种简单而有效的分类方法,在许多....
图2-丨文本分类四大阶段??第一阶段是文本表示阶段,主要内容是对训练数据进行预处理、特征处理等??操作,目的是将文本表示成计算机能够识别的向量格式[53]
文本表示模型、文本分类算法、交叉验证及效果评价。??2.1文本分类流程??一般来说,一个完整的中文信息分类由四个阶段组成[521如图2-1所示。?????1?|?|训练过程 ̄??J—????1?1??q预处理?H特征处理昀文術??^?f?IS:?f=,?!??..文術1?学习c=....
图2一3KNN分类示例{胡
K-最近邻算法是一种考虑到基本识别问题的非常简单的分类器,由于性、非参数性和易于实现的特性,在许多应用中得到了尝试,但是分类时很难找到K的最优值。K的最佳选择和数据息息相关,一般来说,K值越噪声对分类的影响越小,但是类之间的边界越不明显。为了克服这一缺点,采用各种启发式技术来选择....
图2一5决策树分类示树l闭
叶节点?叶节点?叶节点?叶节点?叶节点??图2-4决策树分类原理??决策树本质上是训练数据空间的分层分解,其中使用属性值或条件来分数据空间。在决策树中递归地执行数据空间的划分,直到叶节点包含特量的记录,或类的一些条件。叶节点中的多数类标签(或成本加权多数标分类。为了进一步减少过拟....
本文编号:3898543
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3898543.html