基于社交网络热点事件库的流行度预测研究
发布时间:2022-01-15 11:49
社交网络信息流行度是热点事件受关注程度的量化指标。广大网络用户通过在线社交网络发布和转发信息,表达对社会热点事件的立场和态度,推动了信息的传播和流行。流行度能够反映网络舆情发生、发展状态。网络舆情能够影响广大网络用户的思想和行为,并可能引发公共安全事件。在社交网络分析需求快速发展的今天,研究流行度预测方法有助于提高网络舆情预测能力,对于实现良好的社会舆论氛围和保障社会公共安全具有重大的现实意义。然而,现有的流行度预测方法距离能够在舆情治理中得到应用还面临着一些挑战,其中既包括庞杂的社交网络大数据为上层流行度分析应用带来的数据表示与组织难题,又包括现有流行度演化预测研究对社交网络特有的演化规律和影响因素考虑不足带来的局限性。本文围绕“面向流行度演化预测的社交网络大数据表示与组织问题”、“流行度演化高峰期预测问题”和“多因素指标的流行度预测问题”三个关键问题,从面向流行度分析与预测的社交网络热点事件库模型、基于社交网络主题标签的流行度高峰期预测、基于社交网络事件库多因素耦合的流行度预测和流行度分析预测平台实现及应用四个方面开展了研究,主要工作和贡献如下:首先,针对利用海量、庞杂的在线社交网...
【文章来源】:北京科技大学北京市 211工程院校 教育部直属院校
【文章页数】:134 页
【学位级别】:博士
【部分图文】:
图2-1全球数据总量每年规模M??第三是Variety
数据是具有生命周期的|45,46]。从数据创建、存储、使用到数据废除有一??个完整的闭环过程。同样,大数据也是具有生命周期的。大数据生命周期是??一个复杂的、连续的系统过程。这一过程通常涉及多个不同的数据阶段。每??一个数据阶段都是数据从产生到消亡的必经环节[47,48],都对应着数据的不同??形态。综合这些数据阶段,从软件工程的角度出发,我们可以将大数据生命??周期过程划分为数据产生、数据获取、数据存储和数据挖掘等四个主要阶段。??这与传统数据过程在数据源、数据输入、存储工具、应用形式等方面存在着??较大的差异(如图2-2所示)。??大数据生命周期过程?传统数据过程??
?北京科技大学博士学位论文???1C?????料?1C??^?\?0_?〇_!?;?O?O?w??图2-3?IC模型与异步1C模型比较—??对于多条信息传播建模,典型的方法包括(1)基于博弈论建模。比如,??Myers等[85]建立了允许信息传播过程中不同传染源之间竞争和合作的统计模??型。该模型描述了非孤立状态下传染源对信息传播的影响。(2)基于传染病??模型建模。比如,5&1^也等[86]建立了一类包含多层复杂网络扩散过程的模型。??这类模型成功地揭示了复杂网络上随机传染病传播过程中的几个重要动态特??性。??2.3.2网络用户行为??网络用户行为存在于社交网络信息传播过程中,包括了访问、交流、转??发等多种形式。它是用户在网络空间各种刺激和作用下产生的主体活动,直??接影响了网络信息的流行度。同时,它也间接反映了用户主体在实体空间的??行为倾向,为基于网络用户的规律预测提供了客观手段。??目前,网络用户行为的研究主要集中于兴趣发现、群体交互、情绪捕捉??等几个方面。其中,兴趣发现是借助建模的方式开展相关研究的。比如Liu??等[87]将网络用户的兴趣分为短期和长期,并通过整合用户在一段时间内的个??人博客文章偏好来进行建模,进而较好地描述用户兴趣的演化过程。Godoy??等[881提出了一种网络文档聚类算法,并通过算法对网络文档的增量、无监督??概念学习来进行建模,进而实现多层次的兴趣显示。White等[89]通过社会、??历史、任务、收集和用户交互等五种不同的上下文信息源来进行建模,并根??据它们的有效性来进行评估,进而提高识别用户兴趣的准确性。??群体交互是从交互时间、交互关系
【参考文献】:
期刊论文
[1]基于领域语义知识库的疾病辅助诊断方法[J]. 陈德彦,赵宏,张霞. 软件学报. 2020(10)
[2]面向众包数据清洗的主动学习技术[J]. 叶晨,王宏志,高宏,李建中. 软件学报. 2020(04)
[3]TSL:基于连接强度的Facebook消息流行度预测模型[J]. 王晓萌,方滨兴,张宏莉,王星. 通信学报. 2019(10)
[4]数据治理技术[J]. 吴信东,董丙冰,堵新政,杨威. 软件学报. 2019(09)
[5]事件库构建技术综述[J]. 薛聪,高能,查达仁,王雷,尹芷仪,曾泽华. 信息安全学报. 2019(02)
[6]新型数据管理系统研究进展与趋势[J]. 崔斌,高军,童咏昕,许建秋,张东祥,邹磊. 软件学报. 2019(01)
[7]大数据管理系统的历史、现状与未来[J]. 杜小勇,卢卫,张峰. 软件学报. 2019(01)
[8]数据模型及其发展历程[J]. 信俊昌,王国仁,李国徽,高云君,张志强. 软件学报. 2019(01)
[9]社交媒体中的谣言识别研究综述[J]. 刘雅辉,靳小龙,沈华伟,鲍鹏,程学旗. 计算机学报. 2018(07)
[10]流行度演化分析与预测综述[J]. 胡颖,胡长军,傅树深,黄建一. 电子与信息学报. 2017(04)
博士论文
[1]社交网络中内容流行度的预测方法研究[D]. 鲍泽民.北京交通大学 2019
[2]社交网络热点话题传播分析和预测[D]. 黄建一.北京科技大学 2019
[3]社交网络中流行度演化分析与预测问题研究[D]. 胡颖.北京科技大学 2019
[4]面向在线媒体的信息流动模式分析及流行度预测方法研究[D]. 常标.中国科学技术大学 2018
[5]在线社会网络中影响力度量和流行度预测问题研究[D]. 高帅.山东大学 2015
[6]基于微博平台的事件趋势分析及预测研究[D]. 田野.武汉大学 2012
硕士论文
[1]基于社交网络的信息流行度预测方法研究[D]. 艾擎.电子科技大学 2020
[2]基于深度学习的安全新闻流行度预测研究[D]. 孔君莉.西安电子科技大学 2019
[3]基于深度学习的社交网络跨媒体大数据搜索研究[D]. 石岩松.北京邮电大学 2019
[4]社交网络跨媒体国民安全语义学习与微博话题搜索的研究[D]. 王聪.北京邮电大学 2019
[5]基于存储模型的HBase查询优化技术研究[D]. 王惟一.南京大学 2018
[6]社交网络数据采集方法研究及系统实现[D]. 杨杰.电子科技大学 2018
[7]社交媒体上消息流行度预测算法的研究[D]. 杨瑞琦.电子科技大学 2018
[8]基于社交网络的趋势预测[D]. 张航.电子科技大学 2017
[9]基于标签的视频流行度预测和推荐算法研究[D]. 柯伟兵.华中科技大学 2016
[10]互联网视频流行度分析与预测系统的设计与实现[D]. 李仑.北京邮电大学 2016
本文编号:3590566
【文章来源】:北京科技大学北京市 211工程院校 教育部直属院校
【文章页数】:134 页
【学位级别】:博士
【部分图文】:
图2-1全球数据总量每年规模M??第三是Variety
数据是具有生命周期的|45,46]。从数据创建、存储、使用到数据废除有一??个完整的闭环过程。同样,大数据也是具有生命周期的。大数据生命周期是??一个复杂的、连续的系统过程。这一过程通常涉及多个不同的数据阶段。每??一个数据阶段都是数据从产生到消亡的必经环节[47,48],都对应着数据的不同??形态。综合这些数据阶段,从软件工程的角度出发,我们可以将大数据生命??周期过程划分为数据产生、数据获取、数据存储和数据挖掘等四个主要阶段。??这与传统数据过程在数据源、数据输入、存储工具、应用形式等方面存在着??较大的差异(如图2-2所示)。??大数据生命周期过程?传统数据过程??
?北京科技大学博士学位论文???1C?????料?1C??^?\?0_?〇_!?;?O?O?w??图2-3?IC模型与异步1C模型比较—??对于多条信息传播建模,典型的方法包括(1)基于博弈论建模。比如,??Myers等[85]建立了允许信息传播过程中不同传染源之间竞争和合作的统计模??型。该模型描述了非孤立状态下传染源对信息传播的影响。(2)基于传染病??模型建模。比如,5&1^也等[86]建立了一类包含多层复杂网络扩散过程的模型。??这类模型成功地揭示了复杂网络上随机传染病传播过程中的几个重要动态特??性。??2.3.2网络用户行为??网络用户行为存在于社交网络信息传播过程中,包括了访问、交流、转??发等多种形式。它是用户在网络空间各种刺激和作用下产生的主体活动,直??接影响了网络信息的流行度。同时,它也间接反映了用户主体在实体空间的??行为倾向,为基于网络用户的规律预测提供了客观手段。??目前,网络用户行为的研究主要集中于兴趣发现、群体交互、情绪捕捉??等几个方面。其中,兴趣发现是借助建模的方式开展相关研究的。比如Liu??等[87]将网络用户的兴趣分为短期和长期,并通过整合用户在一段时间内的个??人博客文章偏好来进行建模,进而较好地描述用户兴趣的演化过程。Godoy??等[881提出了一种网络文档聚类算法,并通过算法对网络文档的增量、无监督??概念学习来进行建模,进而实现多层次的兴趣显示。White等[89]通过社会、??历史、任务、收集和用户交互等五种不同的上下文信息源来进行建模,并根??据它们的有效性来进行评估,进而提高识别用户兴趣的准确性。??群体交互是从交互时间、交互关系
【参考文献】:
期刊论文
[1]基于领域语义知识库的疾病辅助诊断方法[J]. 陈德彦,赵宏,张霞. 软件学报. 2020(10)
[2]面向众包数据清洗的主动学习技术[J]. 叶晨,王宏志,高宏,李建中. 软件学报. 2020(04)
[3]TSL:基于连接强度的Facebook消息流行度预测模型[J]. 王晓萌,方滨兴,张宏莉,王星. 通信学报. 2019(10)
[4]数据治理技术[J]. 吴信东,董丙冰,堵新政,杨威. 软件学报. 2019(09)
[5]事件库构建技术综述[J]. 薛聪,高能,查达仁,王雷,尹芷仪,曾泽华. 信息安全学报. 2019(02)
[6]新型数据管理系统研究进展与趋势[J]. 崔斌,高军,童咏昕,许建秋,张东祥,邹磊. 软件学报. 2019(01)
[7]大数据管理系统的历史、现状与未来[J]. 杜小勇,卢卫,张峰. 软件学报. 2019(01)
[8]数据模型及其发展历程[J]. 信俊昌,王国仁,李国徽,高云君,张志强. 软件学报. 2019(01)
[9]社交媒体中的谣言识别研究综述[J]. 刘雅辉,靳小龙,沈华伟,鲍鹏,程学旗. 计算机学报. 2018(07)
[10]流行度演化分析与预测综述[J]. 胡颖,胡长军,傅树深,黄建一. 电子与信息学报. 2017(04)
博士论文
[1]社交网络中内容流行度的预测方法研究[D]. 鲍泽民.北京交通大学 2019
[2]社交网络热点话题传播分析和预测[D]. 黄建一.北京科技大学 2019
[3]社交网络中流行度演化分析与预测问题研究[D]. 胡颖.北京科技大学 2019
[4]面向在线媒体的信息流动模式分析及流行度预测方法研究[D]. 常标.中国科学技术大学 2018
[5]在线社会网络中影响力度量和流行度预测问题研究[D]. 高帅.山东大学 2015
[6]基于微博平台的事件趋势分析及预测研究[D]. 田野.武汉大学 2012
硕士论文
[1]基于社交网络的信息流行度预测方法研究[D]. 艾擎.电子科技大学 2020
[2]基于深度学习的安全新闻流行度预测研究[D]. 孔君莉.西安电子科技大学 2019
[3]基于深度学习的社交网络跨媒体大数据搜索研究[D]. 石岩松.北京邮电大学 2019
[4]社交网络跨媒体国民安全语义学习与微博话题搜索的研究[D]. 王聪.北京邮电大学 2019
[5]基于存储模型的HBase查询优化技术研究[D]. 王惟一.南京大学 2018
[6]社交网络数据采集方法研究及系统实现[D]. 杨杰.电子科技大学 2018
[7]社交媒体上消息流行度预测算法的研究[D]. 杨瑞琦.电子科技大学 2018
[8]基于社交网络的趋势预测[D]. 张航.电子科技大学 2017
[9]基于标签的视频流行度预测和推荐算法研究[D]. 柯伟兵.华中科技大学 2016
[10]互联网视频流行度分析与预测系统的设计与实现[D]. 李仑.北京邮电大学 2016
本文编号:3590566
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/3590566.html