当前位置:主页 > 科技论文 > 数学论文 >

针对社交网络表示学习的图采样设计

发布时间:2020-10-22 05:26
   随着硬件计算能力的升级,人们现在已经习惯于分析原始数据集而不是抽样得到的小样本数据集。在这样的背景下,复杂网络的大规模分析形成常规。其中,网络表示算法可以将非结构化的网络连接数据转化为结构化的向量数据,使得复杂网络上的经典任务可以使用机器学习的方法解决。然而复杂网络的庞大数量级为实际应用造成了许多难点,因此,如何设计成本低的网络表示算法应用场景依旧是研究的重点。互联网背景下的社交网络存在广泛,应用众多,并且是典型的具有庞大数量级的复杂网络。因此,对社交网络表示学习进行降低成本的流程设计具有重要的现实意义。本文通过设计图采样,探寻降低社交网络表示学习算法运算成本的思路。主要研究内容如下:首先,用文献分析找出图采样应该关注的子图特征。用机器学习决策树特征选择检验以上的子图特征。然后根据子图特征设计相对可控的图采样方法包括:生成树,带参数的随机游走采样,倒排节点度数列表的固定变长/滑动窗口采样法。并使用社交网络的“优先连接原则”的特征,改进倒排节点度数列表的滑动窗口采样法,直接对每个窗口内生成的子图边数进行估算。其次,设计将图采样与网络表示学习结合起来的流程,设计子图节点向量表示计算得到全图节点向量表示的重心法。以只需要网络结构信息的链接预测作为下游任务。之后,在随机图以及真实网络数据集上用该流程进一步考察图采样中的其他特征,包括:“最佳边数”,前期实验未验证的高度数节点,以及上文所设计的根据社交网络的“优先连接原则”特征估算边数的改进方案。其中,第一项首先在真实数据集的实验过程中发现,后用随机图进行分析验证;第二项在随机图上进行;最后一项在4个真实网络数据集上进行。最后,以一个真实网络数据集为例,展示如何使用设计的图采样方法迅速找到适用的子图。说明在实际中,不需要使得采样的子图边数达到“最佳边数”,用较少的边在一些简单任务如“链接预测”中也能够得到很好的效果。本文的主要贡献以及创新点有:(1)提出了一个将图采样和社交网络表示学习结合起来的框架。包含图采样方法的设计,子图节点向量表示为全图节点向量的重心法。(2)验证了“高边数,高平均度数”的采样子图能得到好的全图网络表示。(3)提出了“最佳边数”。随机图上的结果表示,图密度越高,“最佳边数”占边数的比率越低。(4)在4个真实数据集上验证了,“优先连接法则”可以较准确地估计子图的边数。从而在设计针对社交网络或是其他无标度网络表示学习的图采样时,用节点度数估算得到边数能够有效降低在图上查找计算边数的成本。(5)提出了在规定成本内,使用设计的改进版倒排节点度数列表滑动窗口采样可迅速得到适用的子图的步骤。本文的设计和结论不局限于社交网络。用图采样帮助降低网络表示学习的成本的设计可容易地拓展到其他网络。其中,“高边数”适用于所有的以边连接信息为直接或隐含输入的网络表示算法,即是大部分流行的网络表示算法,不局限与本文所使用的LINE算法,“多采用高度数节点”,以及用“'优先连接法则'估算子图边数”可容易地拓展到其他无标度网络上。
【学位单位】:吉林大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:O157.5
【部分图文】:

拟合


几个真实网络对式2.1的拟合

向量表示,边数,质量,度数


包含的解读有:①对于 个全图,在 络表 使 的节点之间的信息越多,则训练出的 络极 时, 法有效地训练出 个图向量表 。明以上①解读的还有LINE原始论 中的另 个ube数据集中的节点按照度数(0, 1], [2, 3], [4, 66组,统计了这6组节点在多标签分类任务中的表点表现得更好。这可能是因为:点所含的信息量较多,易于训练。(节点对全来表 ,其中 是在该图中节点度数为 的 pipidi图3.1 LINE网络向量表示质量与参与学习的网络边数的关系

曲线,训练效果,度数,采样次数


E论 中所给出的“边采样次数—训练结果”曲线结果次数 够多时,训练结果趋于稳定,并且迅速攀升到上的②。从 由①可知图中的 度数节点所含信息量该多采样图中的较 度数节点。同样,2)“ 图中节e variance)”也 需考虑。因为当训练中的边采样次数 差 带来的不均匀的节点更新的效应会被消除。图3.2 LINE不同组度数节点的训练效果
【相似文献】

相关期刊论文 前10条

1 张晓飞;;以社交网络为基础的企业营销策略[J];商场现代化;2018年22期

2 孙夏卿;;社交网络媒体对大学生赋权的价值体现[J];传播力研究;2018年31期

3 孙金铭;吴珎义;任世浛;赵云龙;高宁;郑啸航;;杭州市使用社交网络大学生MSM人群规模评估研究[J];中国学校卫生;2017年09期

4 范国婷;杨颖;孙刚;赵佳;;基于扰动的社交网络保护方法研究[J];阜阳师范学院学报(自然科学版);2017年04期

5 杨邦林;林媛媛;林谷洋;林惠茹;;社交网络使用对大学生孤独感的影响[J];信阳师范学院学报(哲学社会科学版);2018年02期

6 于建伟;;基于社交网络的人格分析与预测[J];现代计算机(专业版);2018年04期

7 陈洁;;利用社交网络增强大学生思想疏导教育实效性研究[J];戏剧之家;2018年11期

8 魏蒙蒙;陈进;;社交网络招聘的优势分析和应用建议[J];安徽文学(下半月);2018年03期

9 江瑞辰;;大学生人格特征与移动社交网络使用动机的关系——自尊的中介作用[J];成都师范学院学报;2018年02期

10 王碧;;“神话里少不了恶魔”——原型视域下电影《社交网络》人物形象阐释[J];电影评介;2018年07期


相关博士学位论文 前10条

1 王健;突发公共事件背景下在线社交网络信息扩散及治理研究[D];南京师范大学;2018年

2 聂原平;面向社交网络的文本分析关键技术研究[D];国防科学技术大学;2017年

3 朱湘;面向社交网络的信息传播关键技术研究[D];国防科学技术大学;2017年

4 陈伟;社交网络与时空数据连接的关键技术及应用研究[D];苏州大学;2018年

5 唐兴;线上社交网络中用户个体行为挖掘方法研究[D];西安电子科技大学;2016年

6 蒋志雄;宗教社会资本功能的实证研究[D];武汉大学;2014年

7 姚静静;社交网络用户过度使用到理性使用的实证研究[D];中国科学技术大学;2017年

8 Adeel Luqman;基于纵向信息系统生命周期视角理解和预测享乐社交网络的退出意愿[D];中国科学技术大学;2017年

9 彭川;在线社交网络中的信息传播预测模型研究[D];武汉大学;2016年

10 刘立;基于多个社交网络的用户关系分析[D];北京理工大学;2016年


相关硕士学位论文 前10条

1 陈玙;社交网络环境下基于信任约束的观点演化机制研究[D];南京师范大学;2018年

2 常亚飞;社交网络中影响力最大化问题的并行算法研究[D];哈尔滨工业大学;2017年

3 朱一波;面向移动社交网络的用户关系强度并行挖掘算法研究[D];南京师范大学;2018年

4 Gordeeva Tatiana;俄罗斯社交网络上的中国形象[D];上海外国语大学;2018年

5 李杰;基于主题建模和用户行为分析的藏族微博用户群体发现[D];中央民族大学;2018年

6 吴(龙天)飞;移动社交网络中基于智能优化的消息转发机制研究[D];苏州大学;2018年

7 李维杰;基于认知心理学的移动社交网络信息架构设计研究[D];江南大学;2018年

8 章倩雯;社交网络中影响最大化及传播效应的研究[D];华东师范大学;2018年

9 简兴明;社交网络中紧密子图发现与信息推荐算法研究[D];昆明理工大学;2018年

10 方广;基于社交网络用户兴趣的组推荐技术的研究[D];昆明理工大学;2018年



本文编号:2851163

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/yysx/2851163.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户17f17***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com