基于全路径相似度的大规模层次分类算法
发布时间:2021-04-22 18:04
为快速准确地实现大规模层次分类问题,提出词类区分度概念,并以此作为计算类向量的基础。基于类向量,以改进的Rocchio算法计算待分类文本与目标类的相似度,候选出N个最可能的目标类别;根据目标类别的层次拓扑结构,计算待分类文本与N个目标类别的全路径相似度,确定分类类别。实验结果表明,该方法分类效果优于传统算法,其基于文本类全路径相似度的策略明显改善了单纯基于词类区分度的分类算法。
【文章来源】:计算机工程与设计. 2019,40(05)北大核心
【文章页数】:6 页
【文章目录】:
0 引言
1 相关工作
2 基于全路径相似度的大规模层次分类算法
2.1 相关定义
2.2 算法描述
2.3 hadoop平台实现快速训练
3 实验与结论
3.1 实验准备
3.2 评价方法
3.3 分类效果比较
3.3.1 作为简单分类算法的分类效果
3.3.2 作为候选集搜索算法的分类效果
3.3.3 算法整体效果
4 结束语
本文编号:3154223
【文章来源】:计算机工程与设计. 2019,40(05)北大核心
【文章页数】:6 页
【文章目录】:
0 引言
1 相关工作
2 基于全路径相似度的大规模层次分类算法
2.1 相关定义
2.2 算法描述
2.3 hadoop平台实现快速训练
3 实验与结论
3.1 实验准备
3.2 评价方法
3.3 分类效果比较
3.3.1 作为简单分类算法的分类效果
3.3.2 作为候选集搜索算法的分类效果
3.3.3 算法整体效果
4 结束语
本文编号:3154223
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3154223.html