机器学习在中文期刊论文自动分类研究中的应用
发布时间:2017-10-28 10:13
本文关键词:机器学习在中文期刊论文自动分类研究中的应用
更多相关文章: 机器学习 期刊论文 文本自动分类 特征加权 层次分类法
【摘要】:【目的】在机器学习的计算模式下,利用特征加权和浅层次分类方法可以有效实现期刊论文的中图法分类。【应用背景】传统的人工分类方式在大数据环境下显得力不从心,而期刊电子化趋势使得自动分类技术能够有效缓解人工分类的压力。【方法】将机器学习的思想运用到期刊论文的自动分类领域,分析比较支持向量机和BP神经网络算法在期刊论文自动分类中的效果,利用层次分类理念将中图法转化为三层分类体系,将类目号的获取简化为三层分类的实现,基于特征的来源设置特征值的权重。【结果】分类实验表明,支持向量机算法在大规模稀疏数据环境中较BP神经网络算法更合理,三层体系的分类正确率自顶向下分别达到95.05%、92.89%和89.02%,综合正确率接近80%,多来源的特征权重在论文自动分类中较单一权重具有更好的分类效果。【结论】研究表明机器学习方法在期刊论文的自动分类方面具有较高的可行性、合理性和有效性,为期刊论文自动分类的实现提出新的思路。
【作者单位】: 南京大学信息管理学院;
【关键词】: 机器学习 期刊论文 文本自动分类 特征加权 层次分类法
【基金】:江苏省自然科学基金项目“面向专利预警的中文本体学习研究”(项目编号:BK20130587) 国家社会科学基金重点项目“基于语义的馆藏资源深度聚合与可视化展示研究”(项目编号:11AZD090)子课题的研究成果之一
【分类号】:TP181;TP391.1
【正文快照】: 1引言随着信息技术的发展,人们对图书馆信息服务数字化的要求也越来越强烈,数字图书馆建设已经成为图书馆事业发展的重要课题。期刊数字图书馆就是将期刊论文电子化,主要面临两个工作:期刊论文的格式必须有统一标准、期刊论文的分类管理[1]。经过多年的努力,期刊论文现在已经
【参考文献】
中国期刊全文数据库 前10条
1 刘大宁;杨永乐;白林;;SVM核函数对分类精度影响的研究[J];佳木斯大学学报(自然科学版);2012年04期
2 张野;杨建林;;基于KNN和SVM的中文文本自动分类研究[J];情报科学;2011年09期
3 王东波;苏新宁;朱丹浩;年洪东;;基于支持向量机的医学期刊文章自动分类研究[J];情报理论与实践;2011年04期
4 奉国和;;SVM分类核函数及参数选择比较[J];计算机工程与应用;2011年03期
5 牛延莉;张化;;文本自动分类研究进展[J];软件导刊;2008年04期
6 萧莉明;于宽;蔡s,
本文编号:1107791
本文链接:https://www.wllwen.com/wenshubaike/xingzhengshiwu/1107791.html
最近更新
教材专著