当前位置:主页 > 科技论文 > 软件论文 >

基于支持向量机的先秦诸子典籍自动分类研究

发布时间:2019-06-11 04:39
【摘要】:[目的 /意义]在人文计算兴起这一背景下,针对先秦诸子典籍进行自动分类的探究,以更加深入和精准地从古代典籍中挖掘出相应的知识。[方法 /过程]基于《论语》《老子》《管子》《庄子》《孙子》《韩非子》《孟子》《荀子》和《墨子》9种先秦诸子典籍构成的训练和测试语料,采用支持向量机技术,提取TF-IDF、信息增益、卡方统计和互信息为特征,完成针对先秦诸子典籍的自动分类实验。[结果 /结论]基于先秦诸子典籍得到的自动分类模型调和平均值能达到99.21%,效果较好,具有较强的推广和应用价值。
[Abstract]:[purpose / significance] under the background of the rise of humanistic computing, this paper probes into the automatic classification of the classics of the pre-Qin Dynasty in order to excavate the corresponding knowledge from the ancient classics more deeply and accurately. [methods / process] based on the training and test corpus composed of < Analects of Confucius > < Lao Zi > < Zhuangzi > < Sun Tzu > < Han Feizi > < Mencius > < Xunzi > and < Mozi >, TF-IDF, was extracted by support vector machine (SVM). Information gain, chi-square statistics and mutual information are characteristics, and the automatic classification experiment for pre-Qin classics is completed. [results / conclusion] the harmonic average value of the automatic classification model based on the classics of the pre-Qin Dynasty can reach 99.21%, the effect is good, and it has strong popularization and application value.
【作者单位】: 南京农业大学信息科学技术学院;南京农业大学领域知识关联研究中心;
【基金】:国家社科基金重大项目“基于《汉学引得丛刊》的典籍知识库构建及人文计算研究”(项目编号:15ZDB127) 南京农业大学人文社科基金项目(项目编号:SKPT2016001) 国家社会科学基金青年项目“哈佛燕京学社汉学引得丛刊研究”(项目编号:12CTQ019)研究成果之一
【分类号】:TP391.1

【相似文献】

相关期刊论文 前10条

1 谢书娟;;图像自动分类在数字化图书馆中的应用[J];甘肃科技;2011年05期

2 黄莉;李湘东;;基于《中图法》的自动分类研究现状与展望[J];图书情报知识;2012年04期

3 蔡巍;王英林;尹中航;;基于主题提取与兼类噪声消除新方法的自动分类系统[J];情报科学;2009年10期

4 王兰波,张积友,范冰冰;国内信息导航系统中的信息自动分类子系统的设计与实现[J];计算机工程与应用;2002年03期

5 廖勇;;信息处理及文献自动分类的探讨[J];西南民族大学学报(自然科学版);2008年04期

6 王效岳;白如江;王晓笛;祝娜;;海量网络学术文献自动分类系统[J];图书情报工作;2013年16期

7 王洪,贾惠波,徐端颐;基于人工标引的中文学术期刊文献自动分类算法[J];清华大学学报(自然科学版);2002年06期

8 张丽娜;姜新华;;基于模糊神经网络算法的自动分类系统设计[J];内蒙古师范大学学报(自然科学汉文版);2008年01期

9 张志华,刘清平;神经模糊技术在车型自动分类中的应用[J];山西交通科技;2003年S2期

10 楚存坤;李韬;;模糊聚类技术在文献自动分类系统中的应用[J];现代情报;2009年09期

相关会议论文 前1条

1 赵朋朋;高岭;崔志明;;基于查询接口特征的Deep Web数据源自动分类[A];2006年全国开放式分布与并行计算学术会议论文集(二)[C];2006年

相关硕士学位论文 前10条

1 朱婉莹;少数民族文化文本资源自动分类研究[D];云南师范大学;2015年

2 田泱;基于深度学习的自动分类相册系统的设计与实现[D];中山大学;2015年

3 陈玉芹;多类别科技文献自动分类系统[D];华中科技大学;2008年

4 段晓燕;投诉信息自动分类与推送系统的研究与设计[D];北京邮电大学;2013年

5 马芳;基于神经网络的文本挖掘在专利自动分类中的研究与应用[D];山东理工大学;2009年

6 王爽;基于知识库的自动分类系统设计与实现[D];厦门大学;2007年

7 叶鹏;基于机器学习的中文期刊论文自动分类研究[D];南京大学;2013年

8 李可;文献自动分类的文献交流平台的设计与实现[D];北京化工大学;2013年

9 孙忠泽;行政立法草案公众意见自动化分类研究[D];复旦大学;2011年

10 任函;大规模中文网页的自动分类研究[D];华中师范大学;2006年



本文编号:2497021

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2497021.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a5fa6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com