当前位置:主页 > 社科论文 > 图书档案论文 >

基于知识库的多层次文本自动分类研究

发布时间:2021-04-19 11:42
  随着计算机技术的快速发展和网络的日益普及,用户可获取的信息量呈现指数级增长,极大地丰富了用户所处的信息环境,但是,同时造成了信息过载等问题,增加了用户获取所需信息资源的难度。文本分类作为一种简单有效的解决方法,被认为是处理和组织大量文本数据的关键技术,获得了广泛的关注,具有广阔的应用前景。当前对于文本分类的研究主要是从技术角度进行算法改进研究,本文从知识组织的角度提出改进策略,以满足信息层次化组织管理的需求,具体是指:以数据库中标引经验数据为基础,结合《中图法》的类目层次结构,构建了一个多层次知识库,并基于该知识库实现了自顶向下的多层次文本自动分类。全文共分为四部分:(1)绪论部分:主要介绍了论文的研究背景和意义,并给出本文的主要内容和结构。(2)理论和综述部分:对分类知识库和多层次文本分类两个概念及其相关理论基础做了详尽的介绍,并且综述了国内外相关研究。(3)实验设计部分:在理论和综述的基础上,提出了本文的研究方法,具体包括两个主要模块,一是基于《中图法》构建多层次的分类知识库,二是基于知识库实现自顶向下的多层次文本自动分类。通过对涉及到1497个类别的6万余条的语料进行训练获得分类... 

【文章来源】:南京理工大学江苏省 211工程院校

【文章页数】:67 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
目录
图表目录
1 绪论
    1.1 研究背景及意义
    1.2 本文研究内容
    1.3 本文创新点
    1.4 本文组织结构
2 分类知识库
    2.1 知识库的定义及发展
    2.2 分类知识库的研究
        2.2.1 分类知识库与语料库
        2.2.2 分类知识库的构成
        2.2.3 分类知识库研究综述
    2.3 本章小结
3 多层次文本自动分类及技术
    3.1 文本分类概述
        3.1.1 文本分类的定义
        3.1.2 文本分类的流程及技术
        3.1.3 文本分类的研究趋势
    3.2 多层次文本分类概述
        3.2.1 多层次文本分类定义
        3.2.2 多层次分类方法及原理
        3.2.3 多层次文本分类研究综述
    3.3 本章小结
4 基于《中图法》的多层次知识库的构建
    4.1 构建原理
        4.1.1 分类体系的选择
        4.1.2 自底向上的构建原理
        4.1.3 多层次知识库的结构
    4.2 语料来源
    4.3 多层次知识库的构建步骤
        4.3.1 语料预处理
        4.3.2 自底向上逐层训练
    4.4 知识库的结果展示
    4.5 本章小结
5 基于知识库的多层次文本自动分类的实现
    5.1 分类原理
        5.1.1 自顶向下的分类原理
        5.1.2 分类模型的改进
    5.2 多层次文本自动分类实验
        5.2.1 实验设计与实施
        5.2.2 分类结果与模型评价
    5.3 多层次分类系统
        5.3.1 系统框架
        5.3.2 系统展示
    5.4 本章小结
6 总结
致谢
参考文献
附录1
附录2


【参考文献】:
期刊论文
[1]“知识库”概念的扩散与内涵演化[J]. 李聪,王晓光.  图书情报知识. 2012(04)
[2]国内外文本分类研究计量分析与综述[J]. 胡泽文,王效岳,白如江.  图书情报工作. 2011(06)
[3]基于阻塞先验知识的文本层次分类模型[J]. 李文,苗夺谦,卫志华,王炜立.  模式识别与人工智能. 2010(04)
[4]突发事件网络舆情信息分类方法研究[J]. 郑魁,疏学明,袁宏永,金思魁.  计算机应用与软件. 2010(05)
[5]多层文本分类性能评价方法[J]. 宋胜利,鲍亮,陈平.  系统工程与电子技术. 2010(05)
[6]基于多Agent协作的自动分类知识库研究[J]. 李萌,孙济庆.  情报探索. 2009(05)
[7]基于中心法的多层次文本分类方法的研究[J]. 何尧,陈治平,杨亚蕾.  信息技术. 2007(12)
[8]使用机器学习方法进行新闻的情感自动分类[J]. 徐军,丁宇新,王晓龙.  中文信息学报. 2007(06)
[9]文本层次分类中特征项权重算法的比较研究[J]. 谭金波.  情报杂志. 2007(09)
[10]一种改进的文档层次分类方法[J]. 谭金波.  现代图书情报技术. 2007(02)

硕士论文
[1]基于分词的中文文本自动分类研究与实现[D]. 张海燕.湖南大学 2002
[2]基于知识库的中文网络检索工具——经济信息智能搜索引擎研究[D]. 薛鹏军.南京农业大学 2001



本文编号:3147483

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/3147483.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户24f3f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com