基于有意义串聚类的微博热点话题发现方法
本文关键词: 热点话题 微博 有意义串 特征聚类 出处:《通信学报》2013年S1期 论文类型:期刊论文
【摘要】:针对微博数据特征稀疏、内容碎片化的特点,提出一种基于有意义串聚类的热点话题发现方法。结合重复串计算、上下文邻接分析和语言规则过滤多种策略,提取能够表达独立完整语义的有意义串,并将微博数据建模在相对较小的有意义串空间,通过聚类产生候选话题,根据热度排序发现热点话题。微博数据实验结果表明,该方法在一定程度上实现对微博高维稀疏空间的降维,对于微博空间的热点话题发现有效可行。
[Abstract]:In view of Weibo's sparse data features and fragmentation of content, a hot topic discovery method based on meaningful string clustering is proposed, which combines repeated string computing, context adjacency analysis and language rule filtering. Extracting meaningful strings that can express independent and complete semantics, and modeling Weibo data in a relatively small space of meaningful strings, generate candidate topics by clustering, and find hot topics according to heat ranking. The experimental results of Weibo data show that, To a certain extent, this method can reduce the dimension of Weibo's high-dimensional sparse space, and it is effective and feasible for the hot topic in Weibo space.
【作者单位】: 中国科学院计算技术研究所;国家计算机网络应急技术处理协调中心;
【基金】:国家科技支撑基金资助项目(2012BAH46B01) 国家自然科学基金资助项目(61170230)~~
【分类号】:TP393.092;TP391.1
【相似文献】
相关期刊论文 前10条
1 姜宁,宫秀军,史忠植;高维特征空间中文本聚类研究[J];计算机工程与应用;2002年10期
2 李峰,彭嘉雄,桑红石;基于广义RoI的遥感图像压缩[J];华中科技大学学报(自然科学版);2003年04期
3 林荣,姜云飞;基于特征模糊相关的特征聚类算法[J];现代计算机;2004年10期
4 缑水平;焦李成;;基于多尺度几何分析与核匹配追踪的图像识别[J];模式识别与人工智能;2007年06期
5 刘海峰;刘守生;姚泽清;张学仁;;一种基于改进K-means聚类的文本特征选择模型[J];微电子学与计算机;2009年06期
6 程洪;郑南宁;刘铁;高振海;;基于均值移动和特征聚类的道路识别方法[J];模式识别与人工智能;2002年04期
7 李乔亮;汪国有;刘建国;陈少波;;基于局部特征聚类匹配的多谱图像配准方法[J];计算机工程;2009年15期
8 张成彬;唐建;;基于互信息最大化和特征聚类的特征选择[J];现代计算机(专业版);2009年08期
9 罗毅辉;熊曙初;王四春;范强;;无监督环境下基于聚类集成的特征选择[J];微计算机信息;2008年09期
10 刘海峰;王元元;姚泽清;王倩;;一种基于特征聚类的文本分类模型研究[J];情报学报;2008年02期
相关会议论文 前8条
1 何新;赵亚琴;周献中;;基于多层次支持向量机分类树的音频分类方法[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
2 沈超慧;;基于多尺度特征聚类的三维模型局部形状检索方法[A];第四届和谐人机环境联合学术会议论文集[C];2008年
3 王世星;曹辉兰;靳文芳;蔡玉华;;利用地震不连续性及特征聚类划分塔河油区岩溶储集单元[A];中国地球物理第二十一届年会论文集[C];2005年
4 王学敏;程君实;;四足步行机器人特征辨识算法[A];1996年中国智能自动化学术会议论文集(下册)[C];1996年
5 王明文;付剑波;罗远胜;陆旭;;基于协同聚类的两阶段文本聚类方法研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
6 刘翼光;熊志勇;沈理;;一种基于多层感知器的脸部识别算法[A];1998年中国智能自动化学术会议论文集(下册)[C];1998年
7 王晓丹;赵荣椿;;一种基于视觉感知特性及改进的模糊Kohonen聚类网络的图象纹理分割方法[A];中国体视学学会图像分析专业、中国体视学学会仿真与虚拟现实专业、中国航空学会信号与信息处理专业第一届联合学术会议论文集[C];2000年
8 郭焱;孟玮;刘建;张人铭;;新疆不同河流斑重唇鱼(Diptychus maculates)形态特征比较研究[A];中国鱼类学会2008学术研讨会论文摘要汇编[C];2008年
相关博士学位论文 前4条
1 梁鹏;基于内容的目标分类识别关键技术研究[D];华南理工大学;2011年
2 黄颖;基于图理论的图像处理与物体识别算法的研究[D];电子科技大学;2012年
3 赵娜乐;基于物理属性的城市快速路交通流特征参数模型[D];北京交通大学;2010年
4 李国波;认证与恢复统一的自嵌入水印算法及其拓展应用研究[D];复旦大学;2011年
相关硕士学位论文 前10条
1 李丹;一种新的基于特征聚类的网络motif识别算法[D];西安电子科技大学;2009年
2 赵娟娟;基于特征聚类的文本分类算法研究[D];华南理工大学;2011年
3 张志良;面向服务聚类的无监督异常检测技术研究[D];中南大学;2009年
4 王志波;基于数据挖掘的垃圾邮件过滤技术研究[D];陕西师范大学;2009年
5 崔春燕;组特征选择算法及其应用研究[D];南京师范大学;2013年
6 陈洪;基于云计算的大规模图像检索后台处理系统实现[D];西南交通大学;2013年
7 胡俊;基于SIFT的车载导航图像匹配方法[D];国防科学技术大学;2010年
8 韩雪婷;基于评论挖掘的产品分析系统的设计与实现[D];北京邮电大学;2013年
9 向建波;大型场景三维重建加速技术研究[D];浙江大学;2013年
10 冀单单;基于互联网的数字音乐盗版检测技术应用研究[D];北方工业大学;2013年
,本文编号:1522137
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1522137.html