基于DTM-LPA的突发事件话题演化方法研究——以H7N9微博为例
本文关键词: 话题演化 动态话题模型 标签传播算法 社区发现 突发事件 出处:《图书与情报》2015年03期 论文类型:期刊论文
【摘要】:传统的动态话题模型在高维、稀疏的微博数据上进行话题演化分析时,存在话题数无法确定与结果可解释性差的问题,为此文章提出了一种结合动态话题模型与社区发现技术的话题演化方法,即DTM-LPA方法,即首先利用动态话题模型选取不同时间窗口中具有较高价值的演化词;然后根据各个时间窗口上的微博构造演化词共现网络;再借用标签传播算法找到演化词之间的社区,并根据演化词社区来追踪各个时间窗口上的话题。最后,文章以新浪微博上H7N9禽流感事件为例进行了实证研究,实验结果表明文章所提出的方法能真实地实现微博话题演化分析。
[Abstract]:When the traditional dynamic topic model is used to analyze the topic evolution on the high dimensional and sparse Weibo data, there is the problem that the number of topics can not be determined and the result can be interpreted. In this paper, a topic evolution method, DTM-LPA method, is proposed, which combines dynamic topic model with community discovery technology. Firstly, the dynamic topic model is used to select the high value evolutional words in different time windows. Then according to Weibo on each time window, the cooccurrence network of evolution words is constructed. Then we use the label propagation algorithm to find the community between the words of evolution and track the topics in each time window according to the community of evolution words. Finally. This paper takes the H7N9 avian influenza event on Sina Weibo as an example. The experimental results show that the method proposed in this paper can truly realize the analysis of Weibo topic evolution.
【作者单位】: 南京理工大学信息管理系;安徽财经大学管理科学与工程学院;江苏省数据工程与知识服务重点实验室(南京大学);
【基金】:国家社会科学基金重大项目“面向突发事件应急决策的快速响应情报体系研究”(项目编号:13&ZD174);国家社会科学基金项目“在线社交网络中基于用户的知识组织模式研究”(项目编号:14BTQ033) 江苏省数据工程与知识服务重点实验室开放课题“在线社交网络上交叉学科用户知识结构发现及其兴趣演变研究”(项目编号:DEKS2014KT006)研究成果之一
【分类号】:R511.7;G206
【正文快照】: 1引言截止2015年3月,新浪微博月均活跃用户数(Mau’s)为1.98亿[1]。尽管每个用户允许发布的微博文本通常受限制于140字以内,但规模如此庞大的微博群体所发布的言论在引发公共议题和公众情绪等方面体现出了强大的舆论引导作用和传播效果。有时微博上一些过激的言论被盲目地操纵
【参考文献】
相关期刊论文 前5条
1 郑斐然;苗夺谦;张志飞;高灿;;一种中文微博新闻话题检测的方法[J];计算机科学;2012年01期
2 洪宇;张宇;刘挺;李生;;话题检测与跟踪的评测及研究综述[J];中文信息学报;2007年06期
3 单斌;李芳;;基于LDA话题演化研究方法综述[J];中文信息学报;2010年06期
4 史剑虹;陈兴蜀;王文贤;;基于隐主题分析的中文微博话题发现[J];计算机应用研究;2014年03期
5 米文丽;孙曰昕;;利用概率主题模型的微博热点话题发现方法[J];计算机系统应用;2014年08期
相关博士学位论文 前1条
1 赵旭剑;中文新闻话题动态演化及其关键技术研究[D];中国科学技术大学;2012年
【共引文献】
相关期刊论文 前10条
1 焦健;瞿有利;;知网的话题更新与跟踪算法研究[J];北京交通大学学报;2009年05期
2 鲁明羽;姚晓娜;魏善岭;;基于模糊聚类的网络论坛热点话题挖掘[J];大连海事大学学报;2008年04期
3 许志凯;徐志明;李栋;李生;;面向互联网新闻的话题检测与追踪[J];智能计算机与应用;2011年03期
4 张瑛;张娅婷;;动态文本会话抽取技术研究[J];电视技术;2011年11期
5 谢林燕;戚银城;孙卓;;地点信息在话题检测中的应用[J];电子科技;2012年01期
6 潘文富;郭友实;;网络舆情监测技术研究综述[J];福建电脑;2011年08期
7 胡艳丽;白亮;张维明;;网络舆情中一种基于OLDA的在线话题演化方法[J];国防科技大学学报;2012年01期
8 石大文;张晖;;基于LDA模型的BBS话题演化[J];工业控制计算机;2012年05期
9 施侃晟;刘海涛;白英彩;宋文涛;周书勇;;便于快速信息融合的主题检测算法[J];电子科技大学学报;2012年06期
10 马彬;洪宇;杨雪蓉;姚建民;朱巧明;;基于语义依存线索的事件关系识别方法研究[J];北京大学学报(自然科学版);2013年01期
相关博士学位论文 前10条
1 陈伟;基于时序文本挖掘的新闻内容理解与推荐技术研究[D];浙江大学;2010年
2 张晓艳;新闻话题表示模型和关联追踪技术研究[D];国防科学技术大学;2010年
3 刘毅捷;视频社区中海量数据管理方法研究[D];中国科学技术大学;2011年
4 刘玉国;基于内容的互联网舆情信息挖掘关键技术研究[D];山东大学;2011年
5 吴永辉;面向专业领域的网络信息采集及主题检测技术研究与应用[D];哈尔滨工业大学;2010年
6 郝秀兰;文本分类技术与应用研究[D];复旦大学;2008年
7 钟茂生;基于内容相关度计算的文本结构分析方法研究[D];上海交通大学;2010年
8 付剑锋;面向事件的知识处理研究[D];上海大学;2010年
9 王会珍;文本内容分类和主题追踪关键技术研究[D];东北大学;2008年
10 田野;基于微博平台的事件趋势分析及预测研究[D];武汉大学;2012年
【二级参考文献】
相关期刊论文 前10条
1 张国梁;肖超锋;;基于SVM新闻文本分类的研究[J];电子技术;2011年08期
2 赵华;赵铁军;张姝;王浩畅;;基于内容分析的话题检测研究[J];哈尔滨工业大学学报;2006年10期
3 张铁男;张亚娟;才华;;基于遗传算法的企业种群进化能力评价[J];哈尔滨工业大学学报;2006年12期
4 徐永东;徐志明;王晓龙;刘远超;;中文文本时间信息获取及语义计算[J];哈尔滨工业大学学报;2007年03期
5 殷贤亮;李猛;;基于分块的网页主题信息自动提取算法[J];华中科技大学学报(自然科学版);2007年10期
6 贾自艳 ,何清 ,张海俊 ,李嘉佑 ,史忠植;一种基于动态进化模型的事件探测和追踪算法[J];计算机研究与发展;2004年07期
7 王琦,唐世渭,杨冬青,王腾蛟;基于DOM的网页主题信息自动提取[J];计算机研究与发展;2004年10期
8 于满泉;骆卫华;许洪波;白硕;;话题识别与跟踪中的层次化话题识别技术研究[J];计算机研究与发展;2006年03期
9 赵华;赵铁军;于浩;郑德权;;基于查询向量的英语话题跟踪研究[J];计算机研究与发展;2007年08期
10 张晨逸;孙建伶;丁轶群;;基于MB-LDA模型的微博主题挖掘[J];计算机研究与发展;2011年10期
【相似文献】
相关硕士学位论文 前4条
1 冯剑楠;持续性敏捷演化方法的研究及其在多角色协同系统中的应用[D];南京理工大学;2014年
2 王雷;基于非功能性特征的软件动态自演化方法研究[D];复旦大学;2008年
3 夏通;软件产品族演化方法及应用研究[D];浙江工业大学;2011年
4 陈芹芹;数字系统在线自主演化方法研究[D];南京航空航天大学;2014年
,本文编号:1480726
本文链接:https://www.wllwen.com/yixuelunwen/chuanranbingxuelunwen/1480726.html