基于LSA和结构特性的微博话题检测
发布时间:2017-12-06 06:26
本文关键词:基于LSA和结构特性的微博话题检测
更多相关文章: 微博 话题检测 文本聚类 语义空间 潜在语义分析
【摘要】:针对传统的话题检测方法在处理大规模微博短文本时出现的降维能力不足和语义信息丢失等问题,提出基于潜在语义分析和结构特性相结合的微博话题检测方法。根据微博的对话属性和传播模型,首先要合并微博讨论树扩展微博文本,创建基于潜在语义分析(LSA)的微博文本模型以解决数据稀疏性问题,最后结合时间信息给出新的相似度计算方法,并采用凝聚层次聚类法检测微博话题。实验结果表明,提出的方法降低了话题检测的错失率,大大提高了微博话题检测的性能。
【作者单位】: 上海理工大学光电信息与计算机工程学院;
【基金】:国家自然科学基金资助项目(61074087) 上海市教育委员会科研创新项目(12ZZ144) 上海市一流学科(系统科学)资助项目(XTKX2012)
【分类号】:TP391.1;TP393.092
【正文快照】: 0引言微博是一种基于Web 2.0技术实现的社会媒体(socialmedia),其允许用户通过Web、WAP以及各种客户端设备及时更新简短文本并公开发布,是一种基于用户关系的信息分享、传播及获取平台。随着网络全球化进程的加快以及移动技术的推广,微博已经成为了网络舆论的主要源头和重要的
【相似文献】
中国期刊全文数据库 前2条
1 陈国兰;孙国梓;;微博平台监测网络突发事件的关键问题研究[J];情报探索;2014年08期
2 ;[J];;年期
,本文编号:1257676
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1257676.html