当前位置:主页 > 管理论文 > 移动网络论文 >

基于主题模型的Twitter事件检测

发布时间:2020-03-01 11:43
【摘要】:随着Twitter等社交网络应用的迅速发展,越来越多的用户在上面发布实时信息、更新个人状态、表达自己的观点想法等。Twitter上的事件检测逐渐成为一个热门的研究话题,吸引了越来越多学者的关注。虽然Twitter上的数据相对于传统的新闻媒体、网络博客等数据有更新实时、覆盖范围广、用户参与度高等优点,但是Tweets数据的单条信息量少、噪音大、更新频繁、总数据量大等特点也给事件检测带来了很大的挑战。 本文提出一种基于主题模型的Twitter事件检测算法GEAM(General and Event-related Aspects Model),该模型通过模拟一条与现实事件相关的Tweet的生成过程将Tweet中描述事件相关方面的词项(Event-related Aspects words)和与事件无关的常用词项(General words)区分开来。同时,我们也提出CollapsedGibbsSampling算法对GEAM模型进行估计和推理,以得到描述不同事件的词项分布。此外,我们还提出了GEAM模型的在线式变形算法,实时检测连续的Tweets数据流中产生的事件并且追踪该事件的演化过程。 本文设计了一系列的实验用以评估GEAM模型的有效性。大规模真实Tweets数据集(超过6百万条Tweets)上的实验表明,GEAM模型在查准率(Precision),查全率(Recall)和重复事件检测率(DERate)都优于传统LDA主题模型。GEAM模型采用(时间,地点,实体,关键词)四元组的形式表示事件的细粒度信息,使得事件检测结果的语义更为清晰。此外,,实验部分还展示了在线式GEAM模型追踪事件演变过程的能力。
【图文】:

贝叶斯网络,多项式,节点,证据


-1 狄利克雷—多项式一元模型的贝叶斯网络图yesian networks of Dirichlet-multinomial unigram个可观察的证据节点,节点外的 plate 观察变量 和 分别是隐含变量和多项

贝叶斯网络,可交换性,性质


图 2-2 贝叶斯网络中节点的马尔科夫毯Fig. 2-2 Markove blanket of node in Bayesian network性计中另一个比较重要的性质是可交换性(exchangeab
【学位授予单位】:上海交通大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP393.09

【共引文献】

相关期刊论文 前10条

1 龚书;瞿有利;田盛丰;;基于语义的自动文摘研究综述[J];北京交通大学学报;2009年05期

2 张小平;周雪忠;黄厚宽;冯奇;陈世波;焦宏官;;一种改进的LDA主题模型[J];北京交通大学学报;2010年02期

3 陶超;谭毅华;彭碧发;田金文;;一种基于概率潜在语义模型的高分辨率遥感影像分类方法[J];测绘学报;2011年02期

4 于芳;陈冬玲;王大玲;于戈;鲍玉斌;;基于PLSA的面向用户的网络搜索(英文)[J];Journal of Southeast University(English Edition);2007年03期

5 何友松;吴炜;陈默;杨晓敏;罗代升;;基于Bag of Features算法的车辆图像识别研究[J];电视技术;2009年12期

6 刘硕研;须德;冯松鹤;刘镝;裘正定;;一种基于上下文语义信息的图像块视觉单词生成算法[J];电子学报;2010年05期

7 孙显;王宏琦;杨志峰;;基于形状统计模型的多类目标自动识别方法[J];电子与信息学报;2009年11期

8 孙显;付琨;王宏琦;;基于空间语义对象混合学习的复杂图像场景自动分类方法研究[J];电子与信息学报;2011年02期

9 陈琳;卢湖川;;基于ML-pLSA模型的目标识别算法[J];电子与信息学报;2011年12期

10 胡正平;戎怡;;基于EILBP视觉描述子结合PLSA的场景分类算法[J];光电工程;2010年11期

相关会议论文 前8条

1 庄连生;唐克坦;马启荣;俞能海;;基于注意力模型的PLSA目标学习算法[A];第十四届全国图象图形学学术会议论文集[C];2008年

2 梁莘q

本文编号:2584032


资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2584032.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户59fde***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com