当前位置:主页 > 科技论文 > 软件论文 >

科技情报分析中LDA主题模型最优主题数确定方法研究

发布时间:2017-12-02 17:19

  本文关键词:科技情报分析中LDA主题模型最优主题数确定方法研究


  更多相关文章: LDA主题模型 相似度 困惑度 科技情报分析


【摘要】:【目的】有效确定科技情报分析中LDA主题模型的最优主题数目。【方法】利用主题相似度度量潜在主题之间的差异,同时结合困惑度提出一种确定LDA最优主题数目的方法,该方法既考虑主题抽取效果同时也考虑模型对新文档的泛化能力。【结果】获取国内新能源领域的科技文献作为数据集,实证结果表明本文提出的最优LDA主题数确定方法与单纯使用困惑度相比,具有更高的主题抽取查准率(91.67%)、F值(86.27%)及科技文献推荐精度(71.25%)。【局限】未针对其他类型的数据集进行新方法的验证,如微博短文本、XML文档等。【结论】本文方法能够有效地从科技文献数据集中抽取辨识度较高的主题,并能够提高科技文献推荐效果。
【作者单位】: 南京理工大学经济管理学院;巢湖学院应用数学学院;
【基金】:国家自然科学基金研究项目“新研究领域科学文献传播网络生长及对传播效果影响研究”(项目编号:71373124) 国家社会科学基金重点项目“大数据环境下社会舆情与决策支持方法体系研究”(项目编号:14AZD084) 江苏高校哲学社会科学重点研究基地(培育点)“社会计算与舆情分析”的研究成果之一
【分类号】:TP391.1
【正文快照】: 1引言LDA(Latent Dirichlet Allocation)[1]主题模型是统计语言模型中的典型代表,近几年在情报分析、知识服务、知识发现等领域得到了广泛的应用,主要集中在科学文献知识挖掘[2-4]、科学研究热点发现与新兴主题探测[5-7]、科学研究主题演化[8-10]、学术评价[11]等研究方向。LD

【相似文献】

中国期刊全文数据库 前10条

1 胡吉明;陈果;;基于动态LDA主题模型的内容主题挖掘与演化[J];图书情报工作;2014年02期

2 刘培奇;孙捷焓;;基于LDA主题模型的标签传递算法[J];计算机应用;2012年02期

3 程艳花;谭怒涛;黄磊;王建英;;图像分块重构和LDA融合的人脸识别方法[J];计算机工程与应用;2009年27期

4 黄正鹏;;一种改进的LDA+算法[J];福建电脑;2008年08期

5 张燕平;窦蓉蓉;赵姝;曹振田;;基于集成学习的规范化LDA人脸识别[J];计算机工程;2010年14期

6 赵炜;陈俊杰;李海芳;;融合LDA和多类SVM的图像语义映射研究[J];计算机工程与应用;2009年18期

7 吴秀清;范丽亚;;基于QR分解和支持向量的伪逆LDA[J];聊城大学学报(自然科学版);2011年04期

8 郑世卓;崔晓燕;;基于半监督LDA的文本分类应用研究[J];软件;2014年01期

9 楚克明;李芳;;基于LDA话题关联的话题演化[J];上海交通大学学报;2010年11期

10 刘杰;张福生;冯达;;基于LDA的潜艇机械噪声识别算法研究[J];舰船电子工程;2013年04期

中国重要会议论文全文数据库 前2条

1 楚克明;李芳;;基于LDA新闻话题的演化[A];第五届全国信息检索学术会议论文集[C];2009年

2 Jussi Koskinen;蔺春涛;高冬;;线阵探测器(LDA)的现状及发展趋势(英文)[A];2004年CT和三维成像学术年会论文集[C];2004年

中国硕士学位论文全文数据库 前10条

1 陈小艳;融合结构信息的LDA扣件状态识别研究[D];西南交通大学;2015年

2 袁胜文;基于LDA的中文科技文献话题演化研究[D];河南工业大学;2015年

3 楚克明;基于LDA的新闻话题演化研究[D];上海交通大学;2010年

4 王敏;基于LDA主题模型的图像场景分类[D];西安电子科技大学;2013年

5 程龙龙;基于LDA的行为定向广告投放算法研究[D];辽宁大学;2014年

6 刘海旭;基于PCA和LDA的文本分类系统设计与实现[D];北京邮电大学;2013年

7 周振宇;基于LDA的微博与传统媒体的话题对比研究[D];上海交通大学;2013年

8 章万锋;基于PCA与LDA的说话人识别研究[D];浙江大学;2004年

9 张艺;基于视觉字典容量自动获取的LDA场景分类研究[D];广东工业大学;2015年

10 周林;LDA端面泵浦板条放大器泵浦光场分布的研究[D];西南交通大学;2012年



本文编号:1245669

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1245669.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户52ba8***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com