当前位置:主页 > 社科论文 > 图书档案论文 >

文本分类算法在高校档案管理中的应用研究.pdf

发布时间:2016-11-22 10:06

  本文关键词:文本分类算法在高校档案管理中的应用研究,由笔耕文化传播整理发布。


中文摘要 论文题目: 文本分类算法在高校档案管理中的应用研究 专 业: 计算机技术 硕士生: 王杨帆 签名 指导教师: 韩家新 签名 胡耀明 签名 摘要 随着我国高等教育的飞速发展,各高校档案馆所管理的档案也越来越多,为此许多 高校都已经装备了档案管理软件来对档案进行计算机管理。然而目前主流的针对高校的 档案管理软件都没有对档案文件进行自动分类的功能,为减轻高校档案馆业务人员的工 作量,本文探索一种适合高校档案的文本自动分类方法。 本文首先较为系统的综述了中文文本分类算法的发展进程和当前文本分类算法的 发展动态,详细的介绍了文本表示、文本特征选择、特征提取,特征加权,分类算法、 分类器的构建、分类器性能评估的研究现状。作者根据高校所管理档案的特点,对传统 的中文文本分类算法中的一些步骤进行了改进,,根据高校档案的周期性、重复性、知识 性等特点,同时借鉴档案馆业务人员在手工对档案进行分类时只需通过观察档案正题名 和责任者信息即可确定其类别的分类方法。提出了依靠类别词库、停用词库和责任者词 库等基础词库来支持以档案正题名和责任者为主要分析对象的基于语义的短文本多因 素加权分类算法。在该算法中首先采用统计分析和人工经验相结合的方法为十个档案大 类的每个小类分别构造了类别词及权值,再从己分类的档案信息中提取责任者信息构造 了责任者词库,并通过人工经验构造了停用词库。 在本算法中,首先通过责任者信息确定一份档案所属的大类,然后对档案正题名进 行去停用词操作并提取其中包含的类别词和权值,之后通过加权求和比较大小确定该档 案所属的类别。实验表明,在档案文件的正题名和责任


  本文关键词:文本分类算法在高校档案管理中的应用研究,由笔耕文化传播整理发布。



本文编号:185524

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/185524.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户52336***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com