基于词向量的微博事件追踪方法
本文关键词:基于词向量的微博事件追踪方法
更多相关文章: 微博 事件追踪 短文本 Skip-gram模型 词向量 语义信息
【摘要】:微博文本长度短,且网络新词层出不穷,使得传统方法在微博事件追踪中效果不够理想。针对该问题,提出一种基于词向量的微博事件追踪方法。词向量不仅可以计算词语之间的语义相似度,而且能够提高微博间语义相似度计算的准确率。该方法首先使用Skip-gram模型在大规模数据集上训练得到词向量;然后通过提取关键词建立初始事件和微博表示模型;最后利用词向量计算微博和初始事件之间的语义相似度,并依据设定阈值进行判决,完成事件追踪。实验结果表明,相比传统方法,该方法能够充分利用词向量引入的语义信息,有效提高微博事件追踪的性能。
【作者单位】: 解放军信息工程大学信息系统工程学院;
【关键词】: 微博 事件追踪 短文本 Skip-gram模型 词向量 语义信息
【基金】:国家高技术研究发展计划(863)(No.2011AA7032030D) 全军军事研究生课题资助项目(No.2011JY002-158) 国家社会科学基金项目(No.14BXW028)
【分类号】:TP391.1
【正文快照】: 1引言随着Web2.0的发展,微博作为社交媒体的代表受到了学术界、商业界以及政府部门的广泛关注。微博(Micro-blog)是一个基于用户关系的信息共享、传播及获取平台,用户不仅能够以140字以内的文本发布消息,实现即时分享,还可以通过微博对某一事件发表评论、表达观点并向其他网民
【相似文献】
中国期刊全文数据库 前10条
1 荆晓远,胡钟山,杨静宇;基于最佳鉴别向量集的多级分类方法[J];控制与决策;1998年S1期
2 孙正;张晓光;徐桂云;胡晓磊;王忠青;;一种具有统计不相关性的最优边界鉴别向量集[J];中国矿业大学学报;2009年06期
3 李传湘;树图组合向量集结构定理[J];计算机学报;1980年04期
4 蔡艳宁;胡昌华;汪洪桥;张琪;;基于支持向量预选取的支持向量域故障预报[J];控制与决策;2009年07期
5 蒋亚军;曾青松;何书前;;一种改进的统计不相关最佳鉴别向量集[J];河南科技大学学报(自然科学版);2010年06期
6 杨静;于旭;谢志强;;改进向量投影的支持向量预选取方法[J];计算机学报;2012年05期
7 韩姗姗;黄凯;王万良;郑建炜;蒋一波;;一种快速的判别公共向量分类方法[J];计算机科学;2014年01期
8 亓亮;杜玉越;;逻辑Petri网变迁使能的判定方法[J];系统仿真学报;2011年S1期
9 沈翠华,刘广利,邓乃扬;一种改进的支持向量分类方法及其应用[J];计算机工程;2005年08期
10 蒋刚;肖建;;一种支持向量预提取方法及应用[J];广西师范大学学报(自然科学版);2006年04期
中国重要会议论文全文数据库 前1条
1 王玲;穆志纯;郭辉;;基于支持向量回归的增量建模方法[A];第25届中国控制会议论文集(上册)[C];2006年
中国硕士学位论文全文数据库 前3条
1 李忠浩;支持向量回归机研究及其应用[D];大连理工大学;2006年
2 王慧;微博话题追踪方法研究与设计[D];北京交通大学;2014年
3 李莉莉;支持向量聚类在人脸检测中的应用[D];昆明理工大学;2007年
,本文编号:593125
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/593125.html