基于影响力传播的中文微博意见领袖挖掘算法的研究与实现
发布时间:2021-09-28 08:58
微博客作为一种新的舆论载体和传播途径,在网络舆情信息发起和传播中起着越来越重要的作用。与传统的博客、论坛和商品评论等载体相比,微博具有无障碍、短消息和实时性等新特点,从而导致其信息迅速传播,影响力迅速扩散。基于此,本文研究中文微博所构成的社交网络中的影响力传播模型,以及基于该模型的意见领袖挖掘算法。首先,由于微博用户的海量性以及信息传播的实时性,传统模型已经很难刻画微博所构成的社交网络中影响力的传播过程,因此本文提出三个针对微博的影响力传播模型,即基本模型、离散时间模型和连续时间模型,以及用户之间影响力的学习算法,通过用户所执行的活动判断其所发表的信息内容对于其他用户所影响力。在新浪微博数据集上的实验表明,本文所提出的模型可以有效反映影响力在微博用户间的传播过程,并预测用户的活动;第二,为分析用户所发表微博内容的相似性,深入研究其影响力传播过程,基于上述模型和微博短消息的特点,提出了针对中文微博语法结构和语义结构的相似性判断方法,以及基于该判断方法的微博文本分类算法。基于新浪微博数据的实验表明了本文所提出的方法对于短文本处理的有效性;最后,基于上述模型和方法,提出了改进的意见领袖挖掘算...
【文章来源】:东北大学辽宁省 211工程院校 985工程院校 教育部直属院校
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
图2.1女子学校餐桌伙伴关系图??Fig.?2.1?School?for?girls?dining?partner?relationship?graph??
用户之间发生了某种互动就会相应的影响他们在社会中的行为。??在社会网络的形式化表达中,使用一张图来表示一个社会网络结构,图中的一个节??点表示一个用户,一条边表示一对社会行动者之间的关系。如图2.1所示。???Elie???Jjem*??图2.1女子学校餐桌伙伴关系图??Fig.?2.1?School?for?girls?dining?partner?relationship?graph??随着对于社会网络结构研究的不断深入,研究者己经对w下几个要点达成了普遍的??共识:??(1)
微博文本和是含有情感词或表情符号的微博文本。通过预处理,我们最终得到微博实验??数据集M,其中包含用户约100万个,微博文本约200万条。??本实验使用ROC曲线来比较各个模型的实验结果。图3.9展示了静态模型中基本??影响力模型和分配影响力模型的比较结果。??一"基本影响力?分配影响力??彿。??呈?0.6?-?^??柿?0.?4?-??Q??1?L?J?1?1??0?0.2?0.4?0.6?0.8?1???假阳率???图3.9静态模型ROC比较??Fig.?3.9?Comparison?of?Static?model?民OC??图3.10展示了动态时间模型的基本影响力和分配影响力模型的比较。3.11比较了静??态时间模型和离散时间模型W及连续时间模型的结果。由3.11图也可1^^看出离散时间模??型、连续时间模型的准确率也要比静态时间模型的准确率高。在做图3.11的对比实验中,??本文只使用了分配影响力来计算真阳率和假阳率,因为从图3.9和图3.10可W看出采用??分配影响为计算的准确率比较高。??图3.12展示了离散时间概率模型和静态时间概率模型的运行时间的比较结果。由该??图可W看出,静态模型和离散时间模型要比连续时间模型效率上高很多,而且离散时间??模型和连续时间模型的真阳率基本相同,所离散时间模型更加适合实际应用,因为它??不仅效率比较高而且结果的准确率也比较高。??-28-??
【参考文献】:
期刊论文
[1]微博话语场中的意见领袖[J]. 雷海平. 现代交际. 2011(08)
[2]微博网络舆情中的意见领袖识别及分析[J]. 刘志明,刘鲁. 系统工程. 2011(06)
[3]微博意见领袖初探[J]. 刘锐. 新闻记者. 2011(03)
[4]微博时代“意见领袖”特点探析[J]. 宋好. 今传媒. 2010(11)
[5]一种基于WordNet和Corpus Statistics的语义相似性计算方法[J]. 张东娜,周春光,刘彦斌,郭东伟. 吉林大学学报(理学版). 2010(05)
硕士论文
[1]社会网络影响力模型及其算法研究[D]. 黎雷.北京交通大学 2010
本文编号:3411613
【文章来源】:东北大学辽宁省 211工程院校 985工程院校 教育部直属院校
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
图2.1女子学校餐桌伙伴关系图??Fig.?2.1?School?for?girls?dining?partner?relationship?graph??
用户之间发生了某种互动就会相应的影响他们在社会中的行为。??在社会网络的形式化表达中,使用一张图来表示一个社会网络结构,图中的一个节??点表示一个用户,一条边表示一对社会行动者之间的关系。如图2.1所示。???Elie???Jjem*??图2.1女子学校餐桌伙伴关系图??Fig.?2.1?School?for?girls?dining?partner?relationship?graph??随着对于社会网络结构研究的不断深入,研究者己经对w下几个要点达成了普遍的??共识:??(1)
微博文本和是含有情感词或表情符号的微博文本。通过预处理,我们最终得到微博实验??数据集M,其中包含用户约100万个,微博文本约200万条。??本实验使用ROC曲线来比较各个模型的实验结果。图3.9展示了静态模型中基本??影响力模型和分配影响力模型的比较结果。??一"基本影响力?分配影响力??彿。??呈?0.6?-?^??柿?0.?4?-??Q??1?L?J?1?1??0?0.2?0.4?0.6?0.8?1???假阳率???图3.9静态模型ROC比较??Fig.?3.9?Comparison?of?Static?model?民OC??图3.10展示了动态时间模型的基本影响力和分配影响力模型的比较。3.11比较了静??态时间模型和离散时间模型W及连续时间模型的结果。由3.11图也可1^^看出离散时间模??型、连续时间模型的准确率也要比静态时间模型的准确率高。在做图3.11的对比实验中,??本文只使用了分配影响力来计算真阳率和假阳率,因为从图3.9和图3.10可W看出采用??分配影响为计算的准确率比较高。??图3.12展示了离散时间概率模型和静态时间概率模型的运行时间的比较结果。由该??图可W看出,静态模型和离散时间模型要比连续时间模型效率上高很多,而且离散时间??模型和连续时间模型的真阳率基本相同,所离散时间模型更加适合实际应用,因为它??不仅效率比较高而且结果的准确率也比较高。??-28-??
【参考文献】:
期刊论文
[1]微博话语场中的意见领袖[J]. 雷海平. 现代交际. 2011(08)
[2]微博网络舆情中的意见领袖识别及分析[J]. 刘志明,刘鲁. 系统工程. 2011(06)
[3]微博意见领袖初探[J]. 刘锐. 新闻记者. 2011(03)
[4]微博时代“意见领袖”特点探析[J]. 宋好. 今传媒. 2010(11)
[5]一种基于WordNet和Corpus Statistics的语义相似性计算方法[J]. 张东娜,周春光,刘彦斌,郭东伟. 吉林大学学报(理学版). 2010(05)
硕士论文
[1]社会网络影响力模型及其算法研究[D]. 黎雷.北京交通大学 2010
本文编号:3411613
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3411613.html