基于改进LDA和K-means算法的主题句聚类
本文关键词:基于改进LDA和K-means算法的主题句聚类 出处:《计算机应用》2016年S2期 论文类型:期刊论文
更多相关文章: 潜在狄立克雷分布 K-means算法 最小描述长度算法 句子聚类
【摘要】:针对隐含狄利克雷分布(LDA)主题个数的随机选定和传统K-means算法初始聚类中心选择的随机性等缺陷,提出一种新颖启发式的主题句聚类方法。该方法利用文档集聚类簇数与拆分为句子集中隐藏的主题数目一致特点,先通过层次聚类分析出文档集聚类簇,采用最小描述长度(MDL)剪枝算法来确定最佳聚类数n个,然后将n作为隐含狄利克雷分布的主题数目的先验参数,计算n个主题所在维度上的重要句子作为初始聚类中心,最终完成隐含主题句聚类。实验结果表明改进后聚类算法克服了噪声数据的干扰,避免了主题数的经验误差,聚类结果更精确。
【作者单位】: 重庆大学计算机学院;
【基金】:国家自然科学基金资助项目(60873200,90818028)
【分类号】:TP391.1
【正文快照】: 0引言随着移动互联网的蓬勃发展,网络信息量以指数级增加,特别是文本信息,如何精准有效地发现、组织和利用海量文本背后的有用信息成为一个热门话题[1]。句子聚类技术作为自然语言处理(Natural Language Processing,NLP)的预处理步骤,对文本进一步分析和处理产生了重要的影响,
【相似文献】
中国期刊全文数据库 前10条
1 张亚萍;胡学钢;;基于K-means的朴素贝叶斯分类算法的研究[J];计算机技术与发展;2007年11期
2 刘运;殷建平;程杰仁;蔡志平;;基于k-Means改进算法的分布式拒绝服务攻击检测[J];计算机工程与科学;2008年12期
3 张济强;高玉良;;遗传模拟退火算法在k-means聚类中的应用[J];电脑知识与技术;2012年07期
4 贾花萍;李尧龙;哈渭涛;史晓影;;K-means聚类神经网络分类器在睡眠脑电分期中的应用研究[J];河南科学;2012年06期
5 李学勇;高国红;孙甲霞;;基于互信息和K-means聚类的信息安全风险评估[J];河南师范大学学报(自然科学版);2011年02期
6 郁雪;李敏强;;一种结合有效降维和K-means聚类的协同过滤推荐模型[J];计算机应用研究;2009年10期
7 屈新怀;高万里;丁必荣;李朕;;基于聚类数和初始值的K-means算法改进研究[J];组合机床与自动化加工技术;2011年04期
8 边鹏;赵妍;苏玉召;;一种改进的K-means算法最佳聚类数确定方法[J];现代图书情报技术;2011年09期
9 宗瑜;金萍;李明楚;;BK-means:骨架初始解K-means[J];计算机工程与应用;2009年14期
10 韩凌波;;一种新的K-means最佳聚类数确定方法[J];现代计算机;2013年30期
中国重要会议论文全文数据库 前6条
1 杨青;刘晔;张东旭;刘畅;;快速查找最优初始聚类数K的改进K-means算法[A];中国自动化学会控制理论专业委员会A卷[C];2011年
2 陈磊;胡佳敏;严华;;K-means算法在散货船代货运系统中的应用[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
3 郑建军;甘仞初;贺跃;毕思飞;;一种基于k-means的聚类集成方法[A];全国第九届企业信息化与工业工程学术会议论文集[C];2005年
4 张望;王辉;;个性化服务中的并行K-Means聚类算法[A];2007年全国开放式分布与并行计算机学术会议论文集(下册)[C];2007年
5 江华;王翰虎;陈梅;;一种基于K-means聚类分组的P2P超结点模型[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年
6 王守强;朱大铭;史士英;;基于输入点集求解k-Means聚类算法[A];第二十六届中国控制会议论文集[C];2007年
中国硕士学位论文全文数据库 前10条
1 陈智;基于K-means聚类算法的机会网络群组移动模型及其长相关性研究[D];湘潭大学;2015年
2 许允栋;K-means聚类算法的改进与应用[D];广西师范大学;2015年
3 丁斌;基于布谷鸟算法的K-means聚类挖掘算法研究[D];合肥工业大学;2015年
4 梁云昭;基于K-means的围棋特征提取方法研究[D];北京理工大学;2015年
5 于洋洋;基于并行K-MEANS聚类分析的社群发现算法研究[D];东北大学;2012年
6 崔晓丽;基于MapReduce的海量数据K-means聚类算法研究[D];大连理工大学;2014年
7 高存彬;基于K-Means聚类法的水团划分算法和可视化研究[D];中国海洋大学;2008年
8 刘建国;改进的K-means算法及其在采油数据分析中的应用[D];北京邮电大学;2010年
9 陈翠卓;移动平台下基于K-means的租房信息聚类算法研究与实现[D];华中师范大学;2014年
10 高利军;基于K-Means聚类算法的智能化站点设计与实现[D];河南科技大学;2007年
,本文编号:1317306
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1317306.html