社交网络节点多标签分类技术研究
发布时间:2021-07-30 22:09
随着互联网的飞速发展,人们在通过互联网进行交流方面取得了长足的进步,也形成了一种新的社交网络基本形式。社交网络是现实世界中人与人之间通信的网络虚拟化,特别是近年来社交网络(如Facebook,腾讯,微博)的飞速发展,吸引了许多邻域的学者来挖掘和分析社交网络中的数据。从而促进了针对广告,公共服务,市场营销,学术交流等的社交网络研究。作为数据挖掘和分析的一种方法,分类问题也被应用到社交网络中。通过对网络中的节点进行分类并通过标签捕获节点的兴趣,爱好,关系或其他可能的特征。社交网络节点多标签分类是本文的主要研究方向,社交网络中节点可以是代表现实中的一个人或者是一个整体组织,每一个节点中都包含了大量的数据,例如:文本、图片、音频、视频。之前多数节点分类问题主要为节点单标签分类,然后由于现今社交网络内节点的数据及属性越来越多,节点单标签分类研究已经难以满足节点标签分类的要求,所以本文主要对节点进行多标签分类。社交网络节点多标签分类问题有两个研究方向:一个是根据节点自身属性对节点进行分类,另一个方向是根据节点之间连接信息对节点进行分类。本文主要工作是根据将节点的自身属性和连接信息进行融合,提出一种...
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
社交网络拓扑图
用Vij来表示节点Vi与节点Vj之间的边,将所有节点之间的边的特征信息同样的提取出来之后与之前的节点的自身属性一起便构成了社交网络拓扑图的数据信息。本文研究的问题如下所述:接受一个大小为N*d的社交网络拓扑图数据,其中N表示拓扑图中节点的数量,d表示每一个节点自身属性的长度。拓扑图中不是每一个节点都带有标签,有标签的节点集合定义为Vl,其余的节点集合定义为Vu。社交网络节点多标签分类是通过拓扑图中节点的自身属性与节点间的连接信息进行的分类运算,而如果仅仅只考虑节点的自身属性来进行分类的话,如图2-2所示。只需要找到与当前待分类节点相似的Vl中的节点,再根据映射关系对当前节点进行标签批注。图2-2仅考虑节点自身属性的分类算法将节点间的连接信息考虑进去之后大致有两种分类方法,一种是直接将连接信息与节点自身属性结合起来寻找其对应的标签分类,如图2-3所示。另一种是将节点之间的连接信息与中心节点的自身属性融合之后重新赋予中心节点新的特征
第二章社交网络及现有多标签分类算法研究9信息,再根据此新的特征信息进行后续分类操作,如图2-4所示。图2-3直接将连接信息与自身属性相融合的节点分类算法图2-4将连接信息与自身属性融合后更新中心节点的节点分类算法图2-2,图2-3与图2-4中X表示中心节点的自身属性,Ф表示节点特征信息与标签的映射关系,Y表示中心节点最后输出的标签集合,A表示节点之间的连接信息,X’表示中心节点由自身属性以及节点之间连接信息融合后得到的新的节点特征信息。接下来首先通过介绍社会科学中的两种常见现象来说明对节点间的连接信息的应用规则,然后介绍相似性度量来确定连接信息的选取规则。2.1.2相似性度量相似性和共同引用规律[39]都是社交网络中频繁出现的两种重要现象,首先相似性顾名思义就是社交网络中一个节点存在与其他节点类似的情况,根据相关邻域的学者研究发现社交网络中两个相似的节点之间往往会存在着紧密的联系也就产生了节点之间的边。例如:人们之间产生联系往往都是由于拥有相同的特点,不论是爱好,年龄,习惯等,而两个完全不相似的人则很难在社交网络之中产生
【参考文献】:
期刊论文
[1]社交网络研究综述[J]. 李立耀,孙鲁敬,杨家海. 计算机科学. 2015(11)
[2]基于潜在变量的异构网络节点分类模型研究[J]. 尹向东,肖辉军. 计算机工程. 2015(07)
本文编号:3312215
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
社交网络拓扑图
用Vij来表示节点Vi与节点Vj之间的边,将所有节点之间的边的特征信息同样的提取出来之后与之前的节点的自身属性一起便构成了社交网络拓扑图的数据信息。本文研究的问题如下所述:接受一个大小为N*d的社交网络拓扑图数据,其中N表示拓扑图中节点的数量,d表示每一个节点自身属性的长度。拓扑图中不是每一个节点都带有标签,有标签的节点集合定义为Vl,其余的节点集合定义为Vu。社交网络节点多标签分类是通过拓扑图中节点的自身属性与节点间的连接信息进行的分类运算,而如果仅仅只考虑节点的自身属性来进行分类的话,如图2-2所示。只需要找到与当前待分类节点相似的Vl中的节点,再根据映射关系对当前节点进行标签批注。图2-2仅考虑节点自身属性的分类算法将节点间的连接信息考虑进去之后大致有两种分类方法,一种是直接将连接信息与节点自身属性结合起来寻找其对应的标签分类,如图2-3所示。另一种是将节点之间的连接信息与中心节点的自身属性融合之后重新赋予中心节点新的特征
第二章社交网络及现有多标签分类算法研究9信息,再根据此新的特征信息进行后续分类操作,如图2-4所示。图2-3直接将连接信息与自身属性相融合的节点分类算法图2-4将连接信息与自身属性融合后更新中心节点的节点分类算法图2-2,图2-3与图2-4中X表示中心节点的自身属性,Ф表示节点特征信息与标签的映射关系,Y表示中心节点最后输出的标签集合,A表示节点之间的连接信息,X’表示中心节点由自身属性以及节点之间连接信息融合后得到的新的节点特征信息。接下来首先通过介绍社会科学中的两种常见现象来说明对节点间的连接信息的应用规则,然后介绍相似性度量来确定连接信息的选取规则。2.1.2相似性度量相似性和共同引用规律[39]都是社交网络中频繁出现的两种重要现象,首先相似性顾名思义就是社交网络中一个节点存在与其他节点类似的情况,根据相关邻域的学者研究发现社交网络中两个相似的节点之间往往会存在着紧密的联系也就产生了节点之间的边。例如:人们之间产生联系往往都是由于拥有相同的特点,不论是爱好,年龄,习惯等,而两个完全不相似的人则很难在社交网络之中产生
【参考文献】:
期刊论文
[1]社交网络研究综述[J]. 李立耀,孙鲁敬,杨家海. 计算机科学. 2015(11)
[2]基于潜在变量的异构网络节点分类模型研究[J]. 尹向东,肖辉军. 计算机工程. 2015(07)
本文编号:3312215
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3312215.html