当前位置:主页 > 管理论文 > 移动网络论文 >

面向微博的事件检测算法研究

发布时间:2021-02-10 12:57
  微博以其便捷快速的信息分享方式及庞大的用户关系网络,使微博信息通过用户网络呈指数急速增长、蔓延,进一步加剧了信息、时代数据丰富而信息匮乏的矛盾。从这些海量繁杂的微博数据中梳理出具有价值的事件信息,不仅可以帮助网友获取自己感兴趣的事件资讯并掌握身边发生的新闻要事,还可以从舆论监控和民意调查的角度协助政府部门进行应急管理和行政决策。然而由于微博数据简短、不规范、新颖的特点,应用传统的网络文本分析和数据挖掘技术的效果不再理想,事件检测领域在特定的微博环境下面临了新的挑战,相关研究尚处于探索阶段,亟待寻求面向微博的有效的事件检测方法。针对微博文本的特点,论文提出了整套面向微博的事件检测模型,并对每个模块进行了详细的算法设计。通过实验证明,该模型可有效、及时、准确地检测出微博数据中的事件信息。课题的主要研究内容和创新点如下:第一,论文提出了一种基于N元关系统计的自监督特征抽取方法。不同于传统的事件检测模型,论文提出了将事件检测重点从文档转换为特征,通过微博数据自身的特点来表示微博特征,从而能更好地表达微博文本所要传递的信息,适应微博文本的特点第二,论文通过引入词激活力和词亲密度的概念,提出了一种... 

【文章来源】:北京邮电大学北京市 211工程院校 教育部直属院校

【文章页数】:63 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第一章 引言
    1.1 课题研究背景及意义
    1.2 国内外研究现状
    1.3 作者的主要研究工作
    1.4 论文的组织结构
第二章 相关工作与概念
    2.1 微博数据爬取技术
        2.1.1 基于数据接口的爬取方法
        2.1.2 基于页面解析的爬取方法
        2.1.3 对比与总结
    2.2 事件检测技术
        2.2.1 相关概念
        2.2.2 话题检测与跟踪
        2.2.3 事件检测
    2.3 面向微博的相关研究
        2.3.1 微博研究概述
        2.3.2 微博的事件检测研究
第三章 面向微博的事件检测算法模型
    3.1 事件检测模型概述
    3.2 微博特征获取
        3.2.1 微博数据特征
        3.2.2 特征获取方法
    3.3 事件检测的词聚类算法
        3.3.1 词激活力算法
        3.3.2 词聚类算法
        3.3.3 事件表示模型
    3.4 基于时间的事件检测与跟踪
        3.4.1 事件的检测
        3.4.2 事件的跟踪
    3.5 事件检测评测体系
        3.5.1 相关概念
        3.5.2 相对事件检测评测
第四章 实验结果与分析
    4.1 数据准备
        4.1.1 用户数据
        4.1.2 微博数据
    4.2 微博数据特征获取算法实验
        4.2.1 特征获取具体结果分析
        4.2.2 特征整体分布结果分析
    4.3 面向微博的事件检测算法实验
        4.3.1 事件检测参数确定
        4.3.2 事件检测结果分析
        4.3.3 事件跟踪结果分析
    4.4 基于文档聚类的事件检测算法的对比实验
        4.4.1 两种方法事件检测结果对比
        4.4.2 相对事件检测评价
    4.5 实验总结
第五章 结束语
    5.1 论文工作总结
    5.2 未来工作展望
参考文献
致谢
攻读学位期间发表的学术论文目录


【参考文献】:
期刊论文
[1]基于微博的六度空间理论研究[J]. 刘宏杰,陆浩,张楠,郑晓龙.  计算机应用研究. 2012(08)
[2]基于隐主题分析和文本聚类的微博客中新闻话题的发现[J]. 路荣,项亮,刘明荣,杨青.  模式识别与人工智能. 2012(03)
[3]一种中文微博新闻话题检测的方法[J]. 郑斐然,苗夺谦,张志飞,高灿.  计算机科学. 2012(01)
[4]基于层次结构的多策略中文微博情感分析和特征抽取[J]. 谢丽星,周明,孙茂松.  中文信息学报. 2012(01)
[5]微博用户特征分析和核心用户挖掘[J]. 何黎,何跃,霍叶青.  情报理论与实践. 2011(11)
[6]新浪微博数据挖掘方案[J]. 廉捷,周欣,曹伟,刘云.  清华大学学报(自然科学版). 2011(10)
[7]微博网络舆情中的意见领袖识别及分析[J]. 刘志明,刘鲁.  系统工程. 2011(06)
[8]新闻数据流的在线事件检测[J]. 陈伟,张成,王灿,卜佳俊,陈纯,陈宏.  浙江大学学报(工学版). 2011(06)
[9]话题检测与跟踪的评测及研究综述[J]. 洪宇,张宇,刘挺,李生.  中文信息学报. 2007(06)
[10]基于多策略优化的分治多层聚类算法的话题发现研究[J]. 骆卫华,于满泉,许洪波,王斌,程学旗.  中文信息学报. 2006(01)

博士论文
[1]突发事件信息提取研究[D]. 杨尔弘.北京语言大学 2005



本文编号:3027389

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3027389.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户476d6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com