基于链路预测的微博用户关系分析
本文关键词:基于链路预测的微博用户关系分析
【摘要】:随着以微博为代表的在线社交网站的发展,微博用户之间形成了复杂的社会网络。针对微博社会网络,研究了影响微博用户之间关系形成的各种因素,提出了基于链路预测的微博用户关系分析模型。首先分析了网络结构特征在微博社会网络中的作用,同时针对微博社会网络的特点,引入微博属性特征,构造基于随机森林的链路预测模型,并将模型应用于新浪微博用户数据集,进行微博用户关系的训练预测,通过比较引入微博属性特征前后的预测性能以及特征的重要性分布,分析了各类特征对微博用户关系形成的影响,揭示了除传统的网络结构特征外,微博属性特征对微博用户关系的形成具有重要的影响力。
【作者单位】: 福州大学福建省网络计算与智能信息处理重点实验室;
【关键词】: 链路预测 社会网络 微博属性 随机森林
【基金】:福建省自然科学基金(2013J01232) 福建省教育厅重点项目(JK2012003) 福建省科技创新平台项目(2009J1007)资助
【分类号】:TP393.092
【正文快照】: 1引言随着移动互联网技术和Web技术的发展,以微博为代表的在线社交网站成为了人们日常交流、娱乐、通信的重要工具。全球最早的微博平台Twitter,经过短短两三年的发展,成为了最大的社交平台,用户数超过5亿。而在中国,根据DCCI互联网数据中心发布的《2012中国微博蓝皮书》显示
【参考文献】
中国期刊全文数据库 前4条
1 吕琳媛;;复杂网络链路预测[J];电子科技大学学报;2010年05期
2 樊鹏翼;王晖;姜志宏;李沛;;微博网络测量研究[J];计算机研究与发展;2012年04期
3 周刚;邹鸿程;熊小兵;黄永忠;;MB-SinglePass:基于组合相似度的微博话题检测[J];计算机科学;2012年10期
4 苏金树;张博锋;徐昕;;基于机器学习的文本分类技术研究进展[J];软件学报;2006年09期
【共引文献】
中国期刊全文数据库 前10条
1 蔡坤琪;;基于相关鉴别分析和随机森林的人脸识别方法[J];安徽电子信息职业技术学院学报;2012年01期
2 范生万;王浩;;贝叶斯网络在高职英语应用能力考试中的应用研究[J];安徽工程科技学院学报(自然科学版);2007年04期
3 范生万;;贝叶斯网络分类模型在教育中的应用研究[J];安徽建筑工业学院学报(自然科学版);2008年01期
4 杨有龙,吴艳;基于进化算法的贝叶斯网络度量[J];兵工学报;2004年05期
5 李开灿,耿直;条件独立性的三种形式及其相互关系[J];北京大学学报(自然科学版);2002年05期
6 许静,郑忠国;有向非循环图的可反向边集合的结构与判定[J];北京大学学报(自然科学版);2003年01期
7 李文斌;刘椿年;钟宁;;基于两阶段集成学习的分类器集成[J];北京工业大学学报;2010年03期
8 文翰;肖南峰;;基于特征分布的半监督分类[J];北京工业大学学报;2012年01期
9 周世斌;白敬华;刘玉树;;统计流形上基于核近邻算法的文本分类研究[J];北京理工大学学报;2010年03期
10 李飞;高小榕;高上凯;;基于随机森林算法的高维脑电特征优选[J];北京生物医学工程;2007年04期
中国重要会议论文全文数据库 前10条
1 贾少春;胡秀珍;;A Method of Predicting theβ-hairpin Motifs in Proteins[A];第四届全国生物信息学与系统生物学学术大会论文集[C];2010年
2 何正焱;王厚峰;;商品品牌名称挖掘[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 李胜朋;王洪礼;冯剑丰;;基于不连续回归树的最大李雅谱诺夫指数计算方法[A];第九届全国振动理论及应用学术会议论文集[C];2007年
4 刘振;代进进;王毅;;贝叶斯网络推理与算法[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
5 谢程利;王金桥;卢汉清;;核森林及其在目标检测中的应用[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
6 张红梅;;基于粗糙集特征约简的SVM集成入侵检测模型[A];2009中国控制与决策会议论文集(3)[C];2009年
7 曹东升;许青松;梁逸曾;陈宪;李洪东;;组合树的集合体和后向消除策略去分类P-糖蛋白化合物[A];第十届全国计算(机)化学学术会议论文摘要集[C];2009年
8 曹东升;许青松;梁逸曾;;Computer-Aided Prediction of Toxicity with Substructure Pattern and Random Forest[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年
9 李梦龙;;Systematically analyze and select key features to microRNA precursors identification based on random forests[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年
10 秦文丽;李益洲;李娟;余乐正;郭延芝;李梦龙;;基于蛋白质序列信息的信号肽上有害非同义单核苷酸多态性的预测[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年
中国博士学位论文全文数据库 前10条
1 于化龙;基于DNA微阵列数据的癌症分类技术研究[D];哈尔滨工程大学;2010年
2 李书艳;单点氨基酸多态性与疾病相关关系的预测及其机制研究[D];兰州大学;2010年
3 姚志明;基于步态触觉信息的身份识别研究[D];中国科学技术大学;2010年
4 邓斌;B2C在线评论中的客户知识管理研究[D];电子科技大学;2010年
5 杜方;复杂网络系统间相似性识别及其应用[D];浙江大学;2010年
6 甘良志;核学习算法与集成方法研究[D];浙江大学;2010年
7 王树云;基于Bayes方法和图限制下正规化方法的变量选择问题及其在基因组数据中的应用[D];山东大学;2010年
8 张晓艳;新闻话题表示模型和关联追踪技术研究[D];国防科学技术大学;2010年
9 齐峰;人工神经树网络模型的优化研究与应用[D];山东师范大学;2011年
10 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年
中国硕士学位论文全文数据库 前10条
1 郑伟;MDL算法用于时间梯度设计试验猪骨骼肌基因调控网络分析上的研究[D];华中农业大学;2010年
2 马冉冉;集成学习算法研究[D];山东科技大学;2010年
3 石国强;基于规则的组合分类器的研究[D];郑州大学;2010年
4 郭明;基于文本分类技术的文本情感倾向性研究[D];郑州大学;2010年
5 陈松峰;利用PCA和AdaBoost建立基于贝叶斯的组合分类器[D];郑州大学;2010年
6 左维松;规则和统计相结合的篇章情感倾向性分析研究[D];郑州大学;2010年
7 刘国峰;数据模板匹配研究及在社保审计中的应用[D];哈尔滨工程大学;2010年
8 李晓光;数据挖掘技术在高校招生和教务管理中的应用[D];哈尔滨工程大学;2010年
9 李红;数据挖掘中特征选择与聚类算法研究[D];大连理工大学;2010年
10 李海燕;互信息特征选择的研究及在代谢组学中的应用[D];大连理工大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 贾自艳 ,何清 ,张海俊 ,李嘉佑 ,史忠植;一种基于动态进化模型的事件探测和追踪算法[J];计算机研究与发展;2004年07期
2 王建会,王洪伟,申展,胡运发;一种实用高效的文本分类算法[J];计算机研究与发展;2005年01期
3 李荣陆,王建会,陈晓云,陶晓鹏,胡运发;使用最大熵模型进行中文文本分类[J];计算机研究与发展;2005年01期
4 杨楠,弓丹志,李_,
本文编号:1112070
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1112070.html