当前位置:主页 > 科技论文 > 软件论文 >

在线社交网络上的高效事件检测模型

发布时间:2017-04-28 11:17

  本文关键词:在线社交网络上的高效事件检测模型,由笔耕文化传播整理发布。


【摘要】:随着计算机技术的不断发展和互联网Web 2.0时代的来临,社交网络(如:Twitter、Facebook、微博)逐渐成为当今国内外社会化媒体的重要平台。微博服务平台作为社交网络的一种,也吸引了越来越多的人通过他们与其他用户之间建立的社交网络来分享他们的日常生活或当前热点事件的看法与观点。凭借其简便快捷的信息生成机制和传播机制,社交网络上每天都会产生大量反映当前社会热点事件的数据信息。社交网络上大规模用户以及海量实时数据,使得热点事件检测成为研究热点,让社会舆情分析、谣言检测或信息推荐都变得可能。社交网络信息的短文本特征和不规范语言给重大焦点事件的检测带来新的挑战。首先,海量的社交网络文本信息流中含有很多与当前热点事件毫无关系的噪音文本信息。其次,大规模的文本数据集合要求热点事件检测方法必须更加高效、准确。社交网络平台中除了文本信息还有大量其他相关信息,现有的事件检测方法没有有效利用此类相关信息,而且对噪音文本数据的处理还不够高效。此外,基于主题模型的事件检测方法最后的检测结果为主题,但不是所有主题都能形成真实事件,需要进一步的识别与判断。现有的事件检测方法对事件的检测结果都需要人工标识,不够智能化。针对以上问题,本文提出了一种新颖的基于PLSA(Probabilistic Latent Semantic Analysis)的热点事件检测模型EVE(Efficient e Vent d Etection),通过分析微博平台上的文本数据流来聚类内容相似的微博帖子从而实现热点事件的检测。本论文的主要研究内容和创新点如下:1.经过对社交网络平台相关信息的研究,EVE事件检测模型充分利用微博与用户之间相互增强的关系,提出并采用了关系评价算法来筛选出高质量的微博和高影响力的用户,减小噪音文本的影响和降低数据集合的规模,从而达到高效率、高精度地检测热点事件的目的。2.为了进一步提高事件检测的效率,通过对参数估计算法的深刻理解和研究,提出并使用一种基于微博权威值赋值初始化方法来对EM参数估计算法中的目标参数进行初始化赋值,加快EM算法的收敛速度,从而提高事件检测的效率和准确率。3.为了让事件检测更加智能化,通过对相似度算法的研究,提出了基于余弦距离的智能识别真实事件的方法,较高效、较准确地自动判断主题是否形成事件和确定事件的关键微博。实验表明,在时间开销和准确率方面,EVE事件检测模型都优于基准模型,能够高效率、高精度地进行事件检测,且智能识别方法能够准确、智能地判断和显示事件的相关关键微博和关键词等信息。
【关键词】:事件检测 社交网络 HITS 主题模型 微博
【学位授予单位】:江苏大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP393.092;TP391.1
【目录】:
  • 摘要4-6
  • Abstract6-10
  • 第一章 绪论10-19
  • 1.1 研究背景及意义10-12
  • 1.2 国内外研究现状12-15
  • 1.2.1 以事件类型来分类12-13
  • 1.2.2 以实现技术来分类13-15
  • 1.2.3 研究现状总结分析15
  • 1.3 研究目标和内容15-17
  • 1.4 论文的组织结构17-19
  • 第二章 事件检测相关技术研究19-32
  • 2.1 主题模型19-26
  • 2.1.1 隐性语义分析(LSA)和奇异值分解(SVD)19-20
  • 2.1.2 概率潜在语义分析(PLSA)20-26
  • 2.2 HITS算法26-30
  • 2.2.1 Hub页面和Authority页面26-27
  • 2.2.2 核心思想27
  • 2.2.3 HITS算法在搜索领域应用27-29
  • 2.2.4 HITS算法的优缺点分析29-30
  • 2.3 余弦相似度30-31
  • 2.4 本章小节31-32
  • 第三章 社交网络事件检测数据处理与分析模型32-51
  • 3.1 事件检测关键问题分析及改进方法32-33
  • 3.2 EVE事件检测模型33-39
  • 3.2.1 数据处理模块34-36
  • 3.2.2 数据分析模块36-39
  • 3.3 实验与结果分析39-49
  • 3.3.1 实验目的39
  • 3.3.2 实验数据39
  • 3.3.3 基础参数设置39-40
  • 3.3.4 实验对比模型40-41
  • 3.3.5 实验结果对比分析41-49
  • 3.4 本章小节49-51
  • 第四章 智能识别检测事件研究51-57
  • 4.1 关键问题分析及改进方法51-52
  • 4.2 智能识别模块52-54
  • 4.2.1 设定基准微博53
  • 4.2.2 计算余弦距离53-54
  • 4.2.3 定义临界值--λ_P和η_054
  • 4.3 实验结果分析54-56
  • 4.5 本章小节56-57
  • 第五章 总结与展望57-60
  • 5.1 总结57-58
  • 5.2 展望58-60
  • 参考文献60-63
  • 致谢63-64
  • 在学期间的研究成果及发表的学术论文64

【相似文献】

中国期刊全文数据库 前10条

1 杨清;;电网异常检测模型方法设计[J];电测与仪表;2009年S2期

2 纪祥敏;陈秋妹;景林;;面向下一代互联网的异常检测模型研究[J];福建电脑;2013年01期

3 崔艳娜;;一种网络流量异常检测模型[J];计算机与现代化;2013年08期

4 涂旭平;金海;何丽莉;杨志玲;陶智飞;;一种新的网络异常流量检测模型[J];计算机科学;2005年08期

5 吕洪柱;张建平;邓文新;;基于数据挖掘技术的异常检测模型设计[J];高师理科学刊;2007年06期

6 马琳;苏一丹;莫锦萍;;协同推荐系统检测模型的一种优化方法[J];微计算机信息;2010年03期

7 杨清;;基于模糊序列电网异常检测建模方法与研究[J];山西电子技术;2009年05期

8 李雪琴;;基于模糊C均值的异常流量检测模型[J];赣南师范学院学报;2009年06期

9 唐彰国;李焕洲;钟明全;张健;;改进的进程行为检测模型及实现[J];计算机应用;2010年01期

10 申利民;李峰;孙鹏飞;牛景春;;开放企业计算环境下基于信任的行为检测模型[J];计算机集成制造系统;2013年01期

中国重要会议论文全文数据库 前7条

1 刘俊荣;王文槿;刘宝旭;;一种基于网络行为分析的木马检测模型[A];第十六届全国核电子学与核探测技术学术年会论文集(下册)[C];2012年

2 马文忠;郭江艳;陈科成;杨珊;王艳丽;;基于神经网络的供热燃烧系统检测模型的研究[A];2011中国电工技术学会学术年会论文集[C];2011年

3 张广军;贺俊吉;;基于圆结构光的内表面三维视觉检测模型[A];中国仪器仪表学会学术论文集[C];2004年

4 王建平;张自立;魏华;;战术空域冲突检测模型研究[A];Proceedings of 14th Chinese Conference on System Simulation Technology & Application(CCSSTA’2012)[C];2012年

5 武照东;刘英凯;刘春;吴秀峰;;Overlay网络的链路故障检测模型[A];2008通信理论与技术新发展——第十三届全国青年通信学术会议论文集(下)[C];2008年

6 李京鹏;杨林;刘世栋;;防火墙状态检测模型研究[A];第十八次全国计算机安全学术交流会论文集[C];2003年

7 周双娥;熊国平;;基于Petri网的故障检测模型的设计与分析[A];第六届中国测试学术会议论文集[C];2010年

中国博士学位论文全文数据库 前5条

1 蒋鹏;图像内容显著性检测的理论和方法研究[D];山东大学;2016年

2 赵静;网络协议异常检测模型的研究与应用[D];北京交通大学;2010年

3 赵斌;基于图模型的微博数据分析与管理[D];华东师范大学;2012年

4 牛清宁;基于信息融合的疲劳驾驶检测方法研究[D];吉林大学;2014年

5 刘鹏飞;铝合金点焊质量的逆过程检测方法研究[D];天津大学;2008年

中国硕士学位论文全文数据库 前10条

1 朱远文;前端启发式渗透检测模型研究[D];天津理工大学;2015年

2 刘娇;基于高光谱技术的不同品种猪肉品质检测模型传递方法研究[D];华中农业大学;2015年

3 轩照光;ITS系统防碰撞技术研究[D];电子科技大学;2015年

4 祝e,

本文编号:332743


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/332743.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4973b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com