百科词条幂律分布及网络结构学习研究
发布时间:2020-05-27 12:26
【摘要】:近年来,复杂网络引起各个学科的学者的广泛关注,包括社会学,统计物理学,生物学,统计学等学科。无标度网络更能形象地展示现实世界。无标度网络的度分布服从幂律分布,幂律分布广泛存在于自然界与生活的方方面面,且无标度网络中的Hub节点对网络的结构以及功能都起着至关重要的作用。因此关于无标度现象的研究有助于了解实际生活中不同的现象的本质规律。本文主要包括如下两部分内容:(1)针对百度百科词条,收集百科特色词条以及普通词条的编辑历史数据,从整体编辑历史时间间隔和用户编辑历史时间间隔两方面对两组词条分析其分布。通过最大似然估计法计算参数以及似然比检验法对结果进行检验,结果显示,特色词条的整体编辑历史时间间隔分布服从双幂律分布,前半段的参数近似等于1.1,后半段参数均大于2,用户编辑历史时间间隔服从单幂律分布,参数近似等于1.1。普通词条的整体编辑历史时间间隔分布服从单幂律分布,参数近似等于1.1,用户编辑历史时间间隔服从单幂律分布,参数近似等于1.1。(2)聚焦于具有Hub的网络的结构学习问题。在邻域选择框架下,我们基于Hub网络的特点在模型中加入_1L和_2L正则子,从而分别引入网络的稀疏性先验和Hub网络的组先验。对于所得模型,采用坐标下降法求解。模拟数据和真实数据表明所提模型的有效性和实用性。
【图文】:
得11 1= .niix n 计算了两个分布的参数后代入对数似然比判断数据更拟合的分布。2.3 结果分析本节将收集到的特色词条的两组数据和普通词条的两组数据进行分析,词条的区别。首先通过双对数坐标图判断数据是否拟合幂律分布,再用最大法计算幂律分布的参数,最后对幂律分布进行检验。2.3.1 特色词条编辑历史时间间隔分布收集选取的 9 个特色词条的整体编辑历史时间间隔数据,在双对数图上为了更清楚的说明结果,我们将词条分为三组,词条 1,49,98 一组,词99 一组,词条 3,51,100 一组。结果分别是图 1,,图 2,图 3。
得11 1= .niix n 计算了两个分布的参数后代入对数似然比判断数据更拟合的分布。2.3 结果分析本节将收集到的特色词条的两组数据和普通词条的两组数据进行分析,词条的区别。首先通过双对数坐标图判断数据是否拟合幂律分布,再用最大法计算幂律分布的参数,最后对幂律分布进行检验。2.3.1 特色词条编辑历史时间间隔分布收集选取的 9 个特色词条的整体编辑历史时间间隔数据,在双对数图上为了更清楚的说明结果,我们将词条分为三组,词条 1,49,98 一组,词99 一组,词条 3,51,100 一组。结果分别是图 1,图 2,图 3。
【学位授予单位】:西北大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:C811
本文编号:2683533
【图文】:
得11 1= .niix n 计算了两个分布的参数后代入对数似然比判断数据更拟合的分布。2.3 结果分析本节将收集到的特色词条的两组数据和普通词条的两组数据进行分析,词条的区别。首先通过双对数坐标图判断数据是否拟合幂律分布,再用最大法计算幂律分布的参数,最后对幂律分布进行检验。2.3.1 特色词条编辑历史时间间隔分布收集选取的 9 个特色词条的整体编辑历史时间间隔数据,在双对数图上为了更清楚的说明结果,我们将词条分为三组,词条 1,49,98 一组,词99 一组,词条 3,51,100 一组。结果分别是图 1,,图 2,图 3。
得11 1= .niix n 计算了两个分布的参数后代入对数似然比判断数据更拟合的分布。2.3 结果分析本节将收集到的特色词条的两组数据和普通词条的两组数据进行分析,词条的区别。首先通过双对数坐标图判断数据是否拟合幂律分布,再用最大法计算幂律分布的参数,最后对幂律分布进行检验。2.3.1 特色词条编辑历史时间间隔分布收集选取的 9 个特色词条的整体编辑历史时间间隔数据,在双对数图上为了更清楚的说明结果,我们将词条分为三组,词条 1,49,98 一组,词99 一组,词条 3,51,100 一组。结果分别是图 1,图 2,图 3。
【学位授予单位】:西北大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:C811
【参考文献】
相关期刊论文 前4条
1 黄令贺;朱庆华;;百科词条特征及用户贡献行为研究——以百度百科为例[J];中国图书馆学报;2013年01期
2 赵东杰;郝黎;李德毅;王华;何宇;;维基百科词条编辑特性研究[J];计算机科学;2011年S1期
3 苏东旭;杨建梅;;百度百科合作网络的分形生长机制研究[J];计算机应用研究;2010年12期
4 谢伟聪;杨建梅;;维基百科贡献者中的人类动力学模式[J];科学学研究;2010年10期
相关硕士学位论文 前2条
1 肖强;维基百科词条编辑次数幂律分布机制研究[D];南京大学;2014年
2 李欣荣;百度百科与谷歌开源社区比较研究[D];华南理工大学;2011年
本文编号:2683533
本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/2683533.html