当前位置:主页 > 管理论文 > 移动网络论文 >

基于主动学习的微博流行度预测方法

发布时间:2020-04-14 08:52
【摘要】:微博的出现进一步推动了社交网络的发展。微博拥有大量的用户,这些用户通过微博进行信息共享,与其他用户沟通交流,使其成为信息传播的重要途经之一。微博平台每天产生大量的信息,通过微博进行消息的传播与共享,给人们带来便利的同时也有很多挑战。因此,微博等社交网络流行度预测也备受广大学者关注。能够及时准确的预测微博流行度,对于个性化的消息推荐,突发新闻检测和舆情分析等有重要意义。首先,针对传统的基于SVM的主动学习方法选择距离超平面最近的那些样本点,仅考虑了样本的不确定性,致使查询出的未标注样本集存在冗余性和异常值问题,本文提出一种基于SVM的主动学习方法。该方法不仅仅考虑那些不确定的未标注样本,还考虑多样性和代表性,并通过实验验证其在收敛速度、数据标注量以及准确率曲线稳定性等性能优势。其次,针对以往在研究影响微博流行度的相关因素中,忽略了部分对微博发布一小时内的转发结构相关特征和时间特征。本文新增加了基于一小时转发用户建立结构图中的弱关系用户的比例、平均深度、Wiener指数、Randi′c指数及时间特征对微博流行度预测的影响。通过微博数据集进行实验,验证了通过综合考虑这些特征,有效提高了微博流行度的预测性能。最后,针对传统的基于机器学习的微博流行度预测方法中,存在需要大量标注数据作为训练集,在实际应用往往获得大量标注数据成本高,而获取大量未标注数据容易的问题,本文提出基于主动学习的微博流行度预测方法。该方法在少量标注数据和大量未标注数据的前提下,结合发布者的用户特征、微博内容特征、一小时内的转发结构特征以及时间特征,利用提出的一种基于SVM的主动学习方法进行模型训练,预测微博的流行度。通过实验验证了该方法不仅减少标注成本,也提高模型预测效果,表现出良好的性能。
【图文】:

示意图,线性,示意图,特征向量


图 2.3 简单的线性 SVM 示意图{( ) ( ) ( ) ( )}1 1 2 2 3 3=, , , , , ,... ,N N x y x y x y x y ,特征向量,,第 i 个特征向量用 ( =1, 2,3ix i 量机假设输入空间和特征空间一一对应要使用核技巧,将其转换为向量进行 )被定义为:f ( x ) = w x +b 重向量和偏置。能够找到很多个将样本只有一个,就是与分类超平面距离最近间隔边界的法向量被定义为*= ∈nw w R 能够正确分离两类样本的最优分类边界的间隔最远。针对线性可分的数据,能够的却只有一个,可以通过最大间隔法,表示为:

样本,核函数,样本图


核函数使用 RBF 核函数。具体的实验结果如图3.2、图 3.3 及图 3.4 所示。图 3.2 每次选择 100 个样本图 3.3 每次选择 150 个样本
【学位授予单位】:哈尔滨工程大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP393.092;TP18

【相似文献】

相关期刊论文 前10条

1 禾木;;宅男“女神”[J];小溪流(成长校园);2016年12期

2 朱琛刚;程光;;基于收视行为的互联网电视节目流行度预测模型[J];电子与信息学报;2017年10期

3 熊小兵;周刚;黄永忠;马俊;;新浪微博话题流行度预测技术研究[J];信息工程大学学报;2012年04期

4 万圣贤;郭嘉丰;兰艳艳;程学旗;;基于传播模拟的消息流行度预测[J];中文信息学报;2014年03期

5 鲍鹏;徐昊;;基于图注意力时空神经网络的在线内容流行度预测[J];模式识别与人工智能;2019年11期

6 高金华;沈华伟;程学旗;刘悦;;基于相似消息的流行度预测方法[J];中文信息学报;2018年11期

7 米乐;;链接流行度和链接分析[J];互联网天地;2007年03期

8 余江;杨宗凯;杜旭;王泰;;基于两点流行度的流媒体缓存算法[J];华中科技大学学报(自然科学版);2006年10期

9 王景欣;王钺;李一鹏;袁坚;山秀明;冯振明;任勇;;基于资源流行度的对等网络统计特征分析[J];物理学报;2011年11期

10 孔庆超;毛文吉;;基于动态演化的讨论帖流行度预测[J];软件学报;2014年12期

相关会议论文 前1条

1 石磊;卫琳;古志民;石云;;Web对象流行度模型研究[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年

相关重要报纸文章 前3条

1 本报记者 史晓菲;健身神器流行度高[N];消费日报;2014年

2 记者 王秀兰;杜邦发布汽车颜色流行度报告[N];中国化工报;2011年

3 ;太阳镜点燃眉梢[N];重庆商报;2005年

相关博士学位论文 前4条

1 胡颖;社交网络中流行度演化分析与预测问题研究[D];北京科技大学;2019年

2 高帅;在线社会网络中影响力度量和流行度预测问题研究[D];山东大学;2015年

3 张果;面向可共享内容的网内缓存机制研究[D];解放军信息工程大学;2017年

4 付志鹏;结构化P2P网络抖动的应对策略研究[D];国防科学技术大学;2013年

相关硕士学位论文 前10条

1 徐美婷;基于主动学习的微博流行度预测方法[D];哈尔滨工程大学;2019年

2 张超;基于流行度预测的密集异构网络在线热点视频缓存更新策略[D];西南交通大学;2019年

3 谢小秋;面向社交网络的信息流行度预测研究[D];重庆邮电大学;2019年

4 邹晟;边缘计算平台中计算卸载与镜像缓存方法研究与实现[D];北京邮电大学;2019年

5 韩凤娟;基于多任务学习和深度学习的微博预测流行度[D];河南大学;2018年

6 赵命燕;基于流行度的视频发布系统设计与实现[D];贵州大学;2018年

7 马妙丽;雾无线接入网内容流行度预测与边缘缓存方法研究[D];东南大学;2018年

8 李美京;手机APP的口碑影响机制—考虑类别和流行度的实证研究[D];中国科学技术大学;2017年

9 张志伟;基站环境下媒体流行度预测与缓存策略研究[D];中国科学技术大学;2016年

10 董美姣;基于流行度预测的内容中心网络缓存技术研究[D];北京邮电大学;2015年



本文编号:2627124

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2627124.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户91dd0***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com