当前位置:主页 > 论文百科 > 资源利用论文 >

基于hLDA的科技文献主题摘要生成算法与实现——以电力行业论文为例

发布时间:2018-01-17 21:36

  本文关键词:基于hLDA的科技文献主题摘要生成算法与实现——以电力行业论文为例 出处:《图书情报知识》2014年04期  论文类型:期刊论文


  更多相关文章: 科技文献 主题摘要 生成算法 hLDA


【摘要】:随着信息爆炸时代的到来,科技文献数量的快速增长,科技工作者对于科技文献有效信息获取的要求也越来越高。本文提出了一种科技文献主题自动摘要生成算法。利用hLDA模型对科技文献数据集进行主题建模,并通过摘要候选句的选择,综合多个因素的句子打分策略,自动为科技文献中潜在的主题生成摘要。在实验中,提出基于主题覆盖度的摘要评价方法。实验结果验证了本文提出的主题摘要生成算法的有效性。
[Abstract]:With the arrival of the era of information explosion, the number of scientific and technological documents is growing rapidly. In this paper, we propose an automatic summarization algorithm for scientific and technological literature. We use hLDA model to model the subject of sci-tech literature data set. . And through the selection of summary candidate sentences, synthesizing the sentence scoring strategy of multiple factors, automatically generating abstracts for potential topics in the scientific and technological literature. In the experiment. A summary evaluation method based on topic coverage is proposed, and the experimental results demonstrate the effectiveness of the proposed algorithm.
【作者单位】: 南方电网科学研究院;武汉大学信息管理学院;
【基金】:国家自然科学基金项目“多因素融合下的微博话题可信度评估模型及实证研究”(71303179)的成果之一
【分类号】:TP391.1;F426.61
【正文快照】: 1引言近年来,随着互联网的迅速发展以及科学技术的巨大进步,网络信息资源成为人们生活中不可缺少的部分。科技文献数量呈指数型增长。科技工作者越来越陷入到信息的海洋中。为了让科技工作者在海量的文献信息资源中快速地获取有效的信息,必须对信息的筛选和浓缩等问题进行认真

【相似文献】

相关硕士学位论文 前2条

1 刘平安;基于HLDA模型的中文多文档摘要技术研究[D];北京邮电大学;2013年

2 刘红艳;基于hLDA层次主题模型的多文档摘要技术研究[D];北京邮电大学;2012年



本文编号:1438109

资料下载
论文发表

本文链接:https://www.wllwen.com/wenshubaike/qiuzhijiqiao/1438109.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户42dc6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com