当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于全路径相似度的大规模层次分类算法

发布时间:2021-04-22 18:04
  为快速准确地实现大规模层次分类问题,提出词类区分度概念,并以此作为计算类向量的基础。基于类向量,以改进的Rocchio算法计算待分类文本与目标类的相似度,候选出N个最可能的目标类别;根据目标类别的层次拓扑结构,计算待分类文本与N个目标类别的全路径相似度,确定分类类别。实验结果表明,该方法分类效果优于传统算法,其基于文本类全路径相似度的策略明显改善了单纯基于词类区分度的分类算法。 

【文章来源】:计算机工程与设计. 2019,40(05)北大核心

【文章页数】:6 页

【文章目录】:
0 引言
1 相关工作
2 基于全路径相似度的大规模层次分类算法
    2.1 相关定义
    2.2 算法描述
    2.3 hadoop平台实现快速训练
3 实验与结论
    3.1 实验准备
    3.2 评价方法
    3.3 分类效果比较
        3.3.1 作为简单分类算法的分类效果
        3.3.2 作为候选集搜索算法的分类效果
        3.3.3 算法整体效果
4 结束语



本文编号:3154223

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3154223.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1f5f1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com