社交网络关注模式分析应用研究
发布时间:2022-01-24 02:18
在当前大数据时代,包括大型社交网络数据,尤其是微博的出现,对人们的生活和工作产生了巨大影响,甚至由此形成了新的商业模式。微博类平台的实时高效吸引了大量用户。微博关键用户作为构建微博社交网络的基础,极大影响了微博社交网络的形成和发展,因此,微博关键用户组的分析对微博社交网络的研究具有十分重要的理论价值和实践意义。在面向社交网络的数据挖掘中,社交网络数据复杂性对挖掘算法的准确性和执行效率提出了严峻挑战,如何提高算法效率成为了研究的核心问题。本文针对社交网络的垂直数据格式用分别串行和并行的方法进行深入研究。本文的主要工作如下:首先,详细阐述社交网络基本理论,通过用户与用户之间的关注关系建立有向的在线社交网络。介绍社交网络用户影响力、关键用户的研究方法的分类,介绍频繁模式挖掘算法分类,频繁模式挖掘也适用于解决社交网络分析问题。其次,详细解释了社交网络关注模式数据结构,分析对关注模式数据结构还面临着产生候选项集过程中连接动作时间复杂度较高的问题。针对不足,提出基于垂直数据格式的在线社交网络关键用户组发现算法---VDF-Miner算法。将数据进行按位存储,将集合求交的运算改进为位求与,对频繁项集...
【文章来源】:南华大学湖南省
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
社交网络图
南华大学硕士学位论文24表3.3三种算法在retail数据集上不同阈值下的运行时间阈值(%)FoP-Miner运行时间(s)Eclat运行时间(s)VDF-Miner运行时间(s)11369170296635136141354442928539252310311816图3.2FoP-Miner、Eclat和VDF-Miner算法在retail数据集上的实验结果实验表明,在阈值在1%~4%之间时,Eclat算法的运行时间比FoP-Miner要小,在阈值大于4%时,Eclat算法和FoP-Miner算法运行时间基本相当。这说明以垂直格式为基础的频繁挖掘算法Eclat在阈值较小时,时间效率明显要比基于水平格式的FoP-Miner。在阈值10%之前,FoP-Miner算法的时间性能要落后于VDF-Miner算法的时间性能,只有在阈值大于等于10%时,运行时间才基本一致,但总体上看,VDF-Miner的性能要优于FoP-Miner。在VDF-Miner与Eclat算法进行比较时,实验表明,阈值范围在1%至5%这
第3章基于改进垂直数据格式的关注模式方法-VDF-Miner算法25个区间时VDF-Miner算法的时间性能要比Eclat算法好,而阈值在10%这个区间时,两种算法执行时间基本相当,在最小阈值较小的时候,VDF-Miner算法的时间性能优于Eclat算法。在6个阈值条件下,VDF-Miner算法效率大约是FoP-Miner算法的1.8倍,VDF-Miner算法效率大约是Eclat的1.1倍。下面我们在Twitter数据集进行实验,选择的阈值范围为1%~3%,在这范围内,逐步增加1%。然后对FoP-Miner算法、Eclat算法和VDF-Miner算法分别使用Twitter数据集运行,并记录每一个阈值下的运行时间(单位为秒),如表3.4。表3.43三种算法在Twitter数据集上不同阈值下的运行时间阈值(%)FoP-Miner运行时间(s)Eclat运行时间(s)VDF-Miner运行时间(s)11646143211239283923522图3.3FoP-Miner、Eclat和VDF-Miner算法在社交网络数据集SNAPTwitter数据集上的实验结果在Twitter数据集中,在阂值在1%至3%这个区间时,FoP-Miner算法的时间性能要落后于VDF-Miner算法的时间性能,只有在阈值大于等于3%时运行时间才一致,但总体上看,VDF-Miner的性能要优于FoP-Miner。在3个阈值条件下,
【参考文献】:
期刊论文
[1]基于矩阵的Apriori改进算法的关联规则挖掘[J]. 程昌品,邬依林,姜永生. 广东第二师范学院学报. 2019(05)
[2]结合遗传算法的Apriori算法改进[J]. 文武,郭有庆. 计算机工程与设计. 2019(07)
[3]频繁项集挖掘的研究进展及主流方法[J]. 李广璞,黄妙华. 计算机科学. 2018(S2)
[4]融合社交网络与关键用户的并行协同过滤推荐算法[J]. 肖成龙,王宁,王永贵. 计算机应用研究. 2019(10)
[5]大规模社交网络中高效的关键用户选取方法[J]. 郑永广,岳昆,尹子都,张学杰. 计算机应用. 2017(11)
[6]基于Spark框架的FP-Growth大数据频繁项集挖掘算法[J]. 邵梁,何星舟,尚俊娜. 计算机应用研究. 2018(10)
[7]垂直数据格式挖掘频繁项集算法的改进[J]. 邢长征,安维国,王星. 计算机工程与科学. 2017(07)
[8]基于链路预测的微博用户关系分析[J]. 傅颖斌,陈羽中. 计算机科学. 2014(02)
[9]一种基于矩阵的Apriori改进算法[J]. 孙逢啸,倪世宏,谢川. 计算机仿真. 2013(08)
[10]基于个人属性特征的微博用户影响力分析[J]. 马俊,周刚,许斌,黄永忠. 计算机应用研究. 2013(08)
博士论文
[1]社交网络中的社区发现及其应用研究[D]. 黄明清.上海大学 2018
[2]加权网络社区发现与链接预测方法研究[D]. 刘苗苗.燕山大学 2017
[3]基于用户特征的社交网络数据挖掘研究[D]. 廉捷.北京交通大学 2014
硕士论文
[1]社交网络节点影响力研究[D]. 吕志伟.西安电子科技大学 2019
[2]基于用户关系与行为的微博用户影响力评价研究[D]. 李璟.吉林大学 2019
[3]社交网络关联分析技术及应用研究[D]. 任翔.西安电子科技大学 2018
[4]基于用户特征属性的微博话题关键用户挖掘[D]. 柯阳.中国科学院大学(中国科学院人工智能学院) 2018
[5]基于位存储Tid的Eclat算法GPU并行化与分布式研究[D]. 孙宗鑫.天津师范大学 2018
[6]基于用户与消息特征的微博转发预测模型研究[D]. 陈磊.南华大学 2016
[7]一种改进的关联规则算法研究与应用[D]. 陈向华.北京邮电大学 2016
[8]基于垂直数据布局的关联规则挖掘算法研究[D]. 孙志长.北方民族大学 2009
本文编号:3605637
【文章来源】:南华大学湖南省
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
社交网络图
南华大学硕士学位论文24表3.3三种算法在retail数据集上不同阈值下的运行时间阈值(%)FoP-Miner运行时间(s)Eclat运行时间(s)VDF-Miner运行时间(s)11369170296635136141354442928539252310311816图3.2FoP-Miner、Eclat和VDF-Miner算法在retail数据集上的实验结果实验表明,在阈值在1%~4%之间时,Eclat算法的运行时间比FoP-Miner要小,在阈值大于4%时,Eclat算法和FoP-Miner算法运行时间基本相当。这说明以垂直格式为基础的频繁挖掘算法Eclat在阈值较小时,时间效率明显要比基于水平格式的FoP-Miner。在阈值10%之前,FoP-Miner算法的时间性能要落后于VDF-Miner算法的时间性能,只有在阈值大于等于10%时,运行时间才基本一致,但总体上看,VDF-Miner的性能要优于FoP-Miner。在VDF-Miner与Eclat算法进行比较时,实验表明,阈值范围在1%至5%这
第3章基于改进垂直数据格式的关注模式方法-VDF-Miner算法25个区间时VDF-Miner算法的时间性能要比Eclat算法好,而阈值在10%这个区间时,两种算法执行时间基本相当,在最小阈值较小的时候,VDF-Miner算法的时间性能优于Eclat算法。在6个阈值条件下,VDF-Miner算法效率大约是FoP-Miner算法的1.8倍,VDF-Miner算法效率大约是Eclat的1.1倍。下面我们在Twitter数据集进行实验,选择的阈值范围为1%~3%,在这范围内,逐步增加1%。然后对FoP-Miner算法、Eclat算法和VDF-Miner算法分别使用Twitter数据集运行,并记录每一个阈值下的运行时间(单位为秒),如表3.4。表3.43三种算法在Twitter数据集上不同阈值下的运行时间阈值(%)FoP-Miner运行时间(s)Eclat运行时间(s)VDF-Miner运行时间(s)11646143211239283923522图3.3FoP-Miner、Eclat和VDF-Miner算法在社交网络数据集SNAPTwitter数据集上的实验结果在Twitter数据集中,在阂值在1%至3%这个区间时,FoP-Miner算法的时间性能要落后于VDF-Miner算法的时间性能,只有在阈值大于等于3%时运行时间才一致,但总体上看,VDF-Miner的性能要优于FoP-Miner。在3个阈值条件下,
【参考文献】:
期刊论文
[1]基于矩阵的Apriori改进算法的关联规则挖掘[J]. 程昌品,邬依林,姜永生. 广东第二师范学院学报. 2019(05)
[2]结合遗传算法的Apriori算法改进[J]. 文武,郭有庆. 计算机工程与设计. 2019(07)
[3]频繁项集挖掘的研究进展及主流方法[J]. 李广璞,黄妙华. 计算机科学. 2018(S2)
[4]融合社交网络与关键用户的并行协同过滤推荐算法[J]. 肖成龙,王宁,王永贵. 计算机应用研究. 2019(10)
[5]大规模社交网络中高效的关键用户选取方法[J]. 郑永广,岳昆,尹子都,张学杰. 计算机应用. 2017(11)
[6]基于Spark框架的FP-Growth大数据频繁项集挖掘算法[J]. 邵梁,何星舟,尚俊娜. 计算机应用研究. 2018(10)
[7]垂直数据格式挖掘频繁项集算法的改进[J]. 邢长征,安维国,王星. 计算机工程与科学. 2017(07)
[8]基于链路预测的微博用户关系分析[J]. 傅颖斌,陈羽中. 计算机科学. 2014(02)
[9]一种基于矩阵的Apriori改进算法[J]. 孙逢啸,倪世宏,谢川. 计算机仿真. 2013(08)
[10]基于个人属性特征的微博用户影响力分析[J]. 马俊,周刚,许斌,黄永忠. 计算机应用研究. 2013(08)
博士论文
[1]社交网络中的社区发现及其应用研究[D]. 黄明清.上海大学 2018
[2]加权网络社区发现与链接预测方法研究[D]. 刘苗苗.燕山大学 2017
[3]基于用户特征的社交网络数据挖掘研究[D]. 廉捷.北京交通大学 2014
硕士论文
[1]社交网络节点影响力研究[D]. 吕志伟.西安电子科技大学 2019
[2]基于用户关系与行为的微博用户影响力评价研究[D]. 李璟.吉林大学 2019
[3]社交网络关联分析技术及应用研究[D]. 任翔.西安电子科技大学 2018
[4]基于用户特征属性的微博话题关键用户挖掘[D]. 柯阳.中国科学院大学(中国科学院人工智能学院) 2018
[5]基于位存储Tid的Eclat算法GPU并行化与分布式研究[D]. 孙宗鑫.天津师范大学 2018
[6]基于用户与消息特征的微博转发预测模型研究[D]. 陈磊.南华大学 2016
[7]一种改进的关联规则算法研究与应用[D]. 陈向华.北京邮电大学 2016
[8]基于垂直数据布局的关联规则挖掘算法研究[D]. 孙志长.北方民族大学 2009
本文编号:3605637
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3605637.html