基于矩阵分解的链路预测方法研究
发布时间:2021-12-17 06:55
链路预测是网络数据挖掘中的一项基础且重要的研究内容,它是指通过已知的网络拓扑结构以及网络节点属性等信息,预测网络中由于信息丢失造成的未知链接或者未来某个时刻两个节点间可能产生的链接。链路预测问题对于分析网络演化以及研究网络缺失数据补齐具有非常重要的科学意义,并且在好友推荐、电子商务和生物制药等领域具有重要的应用价值。近年来,链路预测在计算机科学、统计物理学和生物学等众多领域受到广泛关注,很多链路预测算法从不同的学科角度被提出。在已有链接预测方法中,矩阵分解方法通过低秩近似原有网络的邻接矩阵来解决链接预测问题,是一类重要的链接预测方法。在基于矩阵分解的链路预测相关方法中,已有方法大多是基于网络的邻接矩阵表示来进行建模,对网络的表示与建模仍然不够准确。为此,本文针对基于矩阵分解的链路预测算法进行了深入的研究,主要内容包括以下两个方面:(1)提出了一种基于边重要度的矩阵分解链路预测算法。该算法从节点度值信息角度提出节点间连边重要度度量方法,对网络中已知连边进行重要度度量,建立基于网络权重矩阵分解的链路预测模型。分别在八个公开网络数据集上与基于度量的链路预测算法和已有矩阵分解预测算法相比较,该...
【文章来源】:山西大学山西省
【文章页数】:54 页
【学位级别】:硕士
【部分图文】:
完整的网络图表示
Food 0.5493 0.3829 0.3754 0.8725 0.3450 0.3271Router 0.4028 0.4793 0.4700 0.7950 0.4628 0.4096Power 0.5406 0.3824 0.4930 0.3824 0.3255 0.3097本章选取了 Football 和 Food 这两个数据集上参数的不同取值对评价指标 AUC的影响情况,如图 3.1 表示的是 Football 和 Food 数据集分别在各自 和K 值取最优的前提下,参数 在区间 0, 0.4上取不同值时的预测精度,图 3.2 表示 Football 和Food 数据集分别在各自 和K 值取最优的前提下,参数 在区间 0, 0.3上取不同值时的实验结果。从图中我们可以看出:(1)全局上看,参数的改变对于算法精度还是有较大程度的影响,在某个区间段内都呈现一个 AUC 指标“先升后降”的趋势,在某一个值时达到实验效果最优。(2)虽然都能够达到实验最优值,但是不同的数据使得这一最优值在参数取不同的值时达到,证明参数的选取与实验所使用的数据规模和数据相关。(3)其他数据集上参数的影响趋势与这两个数据集参数趋势相同。
(a) Football (b) Food图 3.2 参数 对 AUC 的影响图 3.3 表示 Polbook 和 Food 数据集分别在各自 和 取最优值的前提下,矩阵分解低秩维度K 取值不同时对实验结果的影响情况,从图中可以看出,随着 K 值的逐渐增加,实验精度也在不断增加,当精度增加到一个阈值时,随着 K 值的继续增加,实验结果趋于平缓,分解维度的增加不再对实验结果有较大影响。0.50.550.60.650.70.750.80.850.90.9513 6 9 12 15 18 21 24 27 30AUC0.40.50.60.70.80.913 6 9 12 15 18 21 24AUC
本文编号:3539602
【文章来源】:山西大学山西省
【文章页数】:54 页
【学位级别】:硕士
【部分图文】:
完整的网络图表示
Food 0.5493 0.3829 0.3754 0.8725 0.3450 0.3271Router 0.4028 0.4793 0.4700 0.7950 0.4628 0.4096Power 0.5406 0.3824 0.4930 0.3824 0.3255 0.3097本章选取了 Football 和 Food 这两个数据集上参数的不同取值对评价指标 AUC的影响情况,如图 3.1 表示的是 Football 和 Food 数据集分别在各自 和K 值取最优的前提下,参数 在区间 0, 0.4上取不同值时的预测精度,图 3.2 表示 Football 和Food 数据集分别在各自 和K 值取最优的前提下,参数 在区间 0, 0.3上取不同值时的实验结果。从图中我们可以看出:(1)全局上看,参数的改变对于算法精度还是有较大程度的影响,在某个区间段内都呈现一个 AUC 指标“先升后降”的趋势,在某一个值时达到实验效果最优。(2)虽然都能够达到实验最优值,但是不同的数据使得这一最优值在参数取不同的值时达到,证明参数的选取与实验所使用的数据规模和数据相关。(3)其他数据集上参数的影响趋势与这两个数据集参数趋势相同。
(a) Football (b) Food图 3.2 参数 对 AUC 的影响图 3.3 表示 Polbook 和 Food 数据集分别在各自 和 取最优值的前提下,矩阵分解低秩维度K 取值不同时对实验结果的影响情况,从图中可以看出,随着 K 值的逐渐增加,实验精度也在不断增加,当精度增加到一个阈值时,随着 K 值的继续增加,实验结果趋于平缓,分解维度的增加不再对实验结果有较大影响。0.50.550.60.650.70.750.80.850.90.9513 6 9 12 15 18 21 24 27 30AUC0.40.50.60.70.80.913 6 9 12 15 18 21 24AUC
本文编号:3539602
本文链接:https://www.wllwen.com/kejilunwen/yysx/3539602.html