基于语义和引用加权的文献主题提取研究
发布时间:2017-07-25 15:25
本文关键词:基于语义和引用加权的文献主题提取研究
更多相关文章: Labeled-LDA模型 引用内容 主题提取
【摘要】:[目的 /意义]传统的文献主题提取方法主要是通过关键词、摘要、全文等提取文献的主题内容,使得主题内容不全面或存在"噪音",而从文献内容语义出发,结合引用内容提取文献的主题,能够更加准确地提取出多文档的主题内容。[方法 /过程]提出一种面向多文档的基于语义和引用加权的科技文献主题提取算法,利用文献的引用内容和关键词构建Labeled-LDA主题模型,形成文档-主题概率向量,再根据K-means聚类方法聚类文档,提取每类文档集的主题内容。[结果 /结论]以Pub Med生物医学数据库中的数据作为实验数据,测试该方法的可靠性,结果证明该方法能够准确、全面地提取出多文档的主题内容。
【作者单位】: 宁波大学图书馆与信息中心;浙江大学公共管理学院;
【关键词】: Labeled-LDA模型 引用内容 主题提取
【基金】:国家社会科学基金项目“学术型大数据知识组织与服务标准研究”(项目编号:15FTQ002)研究成果之一
【分类号】:G353.1
【正文快照】: 1引言学术文献是知识发现过程的积累形态,是学者们获取知识的主要媒介。信息化时代,电子学术文献的大量增长,促使学者们提出应用主题提取技术来应对信息超载。主题提取技术是指利用各种算法、技术提取出反映一篇或一类文献中心思想的主题词或主题句。该技术目前已经成为自然语
【相似文献】
中国期刊全文数据库 前10条
1 张琪玉;文献主题的构成因素及层次[J];图书情报知识;1985年01期
2 叶千军;;文献主题因素之间关系与分面分析研究[J];图书馆学研究;1987年03期
3 尹春生;;图书文献主题组配一般规律[J];图书馆学通讯;1988年02期
4 曹树金;文献主题分析与标引的核心技巧和规则研究[J];图书情报知识;1989年01期
5 刘延章;关于文献主题分析的几种方法——文献分类基本方法探讨之二[J];河南图书馆学刊;1989年02期
6 张欣毅;;关于文献主题之研究[J];图书馆理论与实践;1993年01期
7 张欣毅;;关于文献主题之研究(续完)[J];图书馆理论与实践;1993年02期
8 王常山;;文献主题的辨识[J];图书情报知识;1987年03期
9 赵洗尘;汉语文献主题描述语句的结构[J];情报理论与实践;1989年04期
10 李凤满;高淑玲;;文献主题提炼刍议[J];图书馆学研究;1991年05期
中国硕士学位论文全文数据库 前1条
1 马秀敏;中国典型管理期刊文献主题发现与演化分析[D];大连理工大学;2011年
,本文编号:571996
本文链接:https://www.wllwen.com/tushudanganlunwen/571996.html
教材专著