基于《知网》的多种类型文献混合自动分类研究
发布时间:2018-01-16 12:26
本文关键词:基于《知网》的多种类型文献混合自动分类研究 出处:《现代图书情报技术》2016年02期 论文类型:期刊论文
【摘要】:【目的】解决由于不同类型文献而产生的特征不匹配等问题,提高待分类文本的分类效果。【方法】使用与待分类文本属于不同文献类型的文本作为语料库的训练集,引入第三方资源《知网》进行语义特征扩展。【结果】利用该方法在网页、图书、非学术性期刊、学术性期刊4种类型文献上进行分类实验,与未经过扩展的分类方法相比,分类准确率提高1.2%至11.0%。【局限】未对每一种文献类型都使用公开语料进行测试,因此本文方法的通用性和实验结果的客观性有待进一步检验。【结论】实验结果表明,该方法具有一定的可行性和实用性,在不同程度上可以消除不同类型文献之间的语义差异,从语料库构建和特征扩展两个途径提高文本自动分类的分类效果。
[Abstract]:The results show that the method has certain feasibility and practicability , which can eliminate the semantic differences among different types of documents , and improve the classification effect of text automatic classification from corpus construction and feature extension .
【作者单位】: 武汉大学信息管理学院;武汉大学信息资源研究中心;
【基金】:国家社会科学基金项目“多种类型文本数字资源自动分类研究”(项目编号:15BTQ066)的研究成果之一
【分类号】:TP391.1
【正文快照】: 1引言随着互联网的迅猛发展,网络上的信息资源日益剧增,人们可以从互联网上源源不断地获取各种形式的信息,如文本、图片、音频、视频等。而文本可以来自于网页、图书、学术期刊论文等众多文献类型,人们可以获得同一主题下具有不同内涵、质量、发布速度的信息。因此,利用文本分
【相似文献】
相关期刊论文 前10条
1 吴慰慈;;文献类型和特点概析[J];图书与情报;1990年04期
2 蒋蕊;简论“文献类型学”[J];黑龙江图书馆;1991年01期
3 ;文献类型[J];电子科技文摘;1999年04期
4 本刊编辑部;;参考文献著录中文献类型、电子文献载体类型标志代码如下[J];黔南民族医专学报;2011年02期
5 黄俊贵;;文献类型标识符探讨[J];广东图书馆学刊;1982年04期
6 王立贵;;文献类型浅说[J];山东图书馆季刊;1985年03期
7 江乃武;再论“连续性出版物”[J];图书情报知识;1986年01期
8 江乃武;;连续性出版物单独管理是发展之必然[J];图书馆理论与实践;1987年01期
9 朱芊;;文献类型因素的主题词和手检标题组配词序的标引方法[J];国家图书馆学刊;1988年03期
10 程磊;;关于文献类型演变规律的研究——从文献内容重复交叉谈起[J];图书情报工作;1991年03期
,本文编号:1433141
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1433141.html