当前位置:主页 > 科技论文 > 软件论文 >

抑制背景噪声的LDA子话题挖掘算法

发布时间:2018-04-25 00:39

  本文选题:子话题挖掘 + 线性判别分析 ; 参考:《华南理工大学学报(自然科学版)》2017年03期


【摘要】:专题文章集合是一些拥有相似背景知识的文章集合.为了更好地从专题文章集合内部的复杂信息关联中高效挖掘子话题信息,文中提出了抑制背景噪声的线性判别分析(LDA)子话题挖掘算法BLDA,通过预先抽取专题文档集合的共同背景知识、在迭代过程中重设关键词的产生等方式提高子话题抽取的准确程度.在微信公众账号文章上的系列实验证明,BLDA算法针对有共同背景的专题文章集合的聚类结果显著优于传统的LDA算法,其中主题召回率提高了170%,Purity聚类指标提高了143%,NMI聚类指标提高了160%.
[Abstract]:A collection of feature articles is a collection of articles with similar background knowledge. In order to effectively mine sub-topic information from the complex information association within the collection of feature articles, In this paper, a linear discriminant analysis (LDA-LDA) subtopic mining algorithm for background noise suppression is proposed. By extracting the common background knowledge of the thematic document set in advance, the accuracy of subtopic extraction can be improved by re-setting the keywords in the iterative process. A series of experiments on WeChat's public accounts show that the clustering results of BDA algorithm for feature articles with common background are significantly better than that of traditional LDA algorithm, in which the recall rate of theme increases by 170% and Purity clustering index increases by 1 43% and 160%.
【作者单位】: 中国科学院计算技术研究所∥中国科学院网络数据科学与技术重点实验室;国家计算机网络应急技术处理协调中心;
【基金】:国家自然科学基金资助项目(61303244,61572473,61572469,61402442,61402022,61370132) 国家242信息安全计划项目(2015F114)~~
【分类号】:TP391.1

【相似文献】

相关期刊论文 前10条

1 陈晓红;陈松灿;;类依赖的线性判别分析[J];小型微型计算机系统;2008年05期

2 刘忠宝;王士同;;改进的线性判别分析算法[J];计算机应用;2011年01期

3 高建强;范丽亚;;模糊线性判别分析中距离对面部识别的影响[J];井冈山大学学报(自然科学版);2012年03期

4 葛熠;王亭亭;韩月;李峰;;基于核双子空间线性判别分析人脸识别方法[J];科技视界;2012年23期

5 任获荣;李春晓;孙建维;秦红波;何培培;高敏;;类依赖增强线性判别分析算法[J];西安电子科技大学学报;2012年05期

6 温凤文;王洪春;;改进的张量线性判别分析[J];黑龙江科技信息;2013年24期

7 赵越;徐鑫;乔利强;;张量线性判别分析算法研究[J];计算机技术与发展;2014年01期

8 赵芳;马玉磊;;基于概率线性判别分析的可扩展似然公式化人脸识别[J];科学技术与工程;2014年06期

9 周大可,杨新,彭宁嵩;改进的线性判别分析算法及其在人脸识别中的应用[J];上海交通大学学报;2005年04期

10 成忠;诸爱士;;一种适于高维小样本数据的线性判别分析方法[J];浙江科技学院学报;2008年02期

相关博士学位论文 前2条

1 任忠国;基于γ特征谱的对象相似性识别技术研究[D];兰州大学;2015年

2 刘忠宝;基于核的降维和分类方法及其应用研究[D];江南大学;2012年

相关硕士学位论文 前10条

1 王金贝;基于奇异值分解的不相关线性判别分析的通解与性质[D];郑州大学;2015年

2 孔昭阳;基于GPU的并行线性判别分析算法研究[D];哈尔滨工业大学;2014年

3 张晶;非欧框架下的线性判别分析[D];辽宁师范大学;2015年

4 乔娜娜;基于生物光子学小麦隐蔽性害虫检测机理及分类研究[D];河南工业大学;2016年

5 杜辉;基于二维图像的人脸识别研究[D];江苏大学;2016年

6 刘超;非迭代三维线性判别分析及其在人脸识别中的应用[D];云南财经大学;2016年

7 霍中花;非重叠监控场景下行人再识别关键技术研究[D];江南大学;2016年

8 苗硕;基于L2,,1范数和L1范数的鲁棒判别特征提取算法研究[D];西安电子科技大学;2015年

9 李卫平;判别准则优化的LDA研究[D];浙江大学;2017年

10 李道红;线性判别分析新方法研究及其应用[D];南京航空航天大学;2005年



本文编号:1799012

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1799012.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ebc5d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com