当前位置:主页 > 科技论文 > 软件论文 >

基于聚类和决策树的链路预测方法

发布时间:2018-07-25 06:12
【摘要】:链路预测是数据挖掘研究的主要问题之一.由于网络的复杂性、数据的多样性,根据网络结构及已有信息对异质网络中的不同类型的数据进行链路预测的问题也变得更加复杂.针对双类型异质信息网络,提出了一种基于聚类和决策树的链路预测方法 CDTLinks.通过将网络中2种类型对象互为特征的方法得到对象的特征表示,并分别进行聚类.对于双类型异质网络提出了3种启发式规则来构建决策树,根据信息增益来选择树中不同分支.最后,根据聚簇分布结果以及决策树模型来判断任意2个不同类型节点之间是否存在链接.另外,定义了潜在链接节点并引入层数的概念,在降低算法运行时间的同时提高了准确率.在DBLP和AMiner数据集上验证了提出的CDTlinks方法,结果表明:在双类型异质网络中,CDTlinks模型能够有效地进行链路预测.
[Abstract]:Link prediction is one of the main problems in data mining. Due to the complexity of the network and the diversity of data, the problem of link prediction for different types of data in heterogeneous networks becomes more complicated according to the network structure and existing information. In this paper, a link prediction method based on clustering and decision tree is proposed for two-type heterogeneous information networks. The two types of objects in the network are characterized by each other, and the feature representation of the objects is obtained, and clustering is carried out respectively. In this paper, three heuristic rules are proposed to construct the decision tree for two-type heterogeneous networks, and different branches of the tree are selected according to the information gain. Finally, according to the result of cluster distribution and the decision tree model, whether there are links between any two different types of nodes is determined. In addition, potential link nodes are defined and the concept of layer number is introduced, which can reduce the running time of the algorithm and improve the accuracy. The proposed CDTlinks method is validated on the DBLP and AMiner datasets. The results show that the proposed CDTlinks links model can effectively predict the links in two types of heterogeneous networks.
【作者单位】: 吉林大学计算机科学与技术学院;符号计算与知识工程教育部重点实验室(吉林大学);
【基金】:国家自然科学基金项目(60903098) 吉林省发改委产业技术研究与开发专项(2015Y055) 吉林省科技厅重点科技攻关项目(20150204040GX)~~
【分类号】:TP311.13

【参考文献】

相关期刊论文 前3条

1 黄立威;李德毅;马于涛;郑思仪;张海粟;付鹰;;一种基于元路径的异质信息网络链路预测模型[J];计算机学报;2014年04期

2 杨柳;曹玖新;刘波;时莉莉;;基于无偏Q值反馈的社区划分算法[J];东南大学学报(自然科学版);2011年01期

3 吕琳媛;;复杂网络链路预测[J];电子科技大学学报;2010年05期

【共引文献】

相关期刊论文 前10条

1 杨妮亚;彭涛;刘露;;基于聚类和决策树的链路预测方法[J];计算机研究与发展;2017年08期

2 刘思;刘海;陈启买;贺超波;;基于网络表示学习与随机游走的链路预测算法[J];计算机应用;2017年08期

3 盛权为;汪一百;高阳;;一种改进的异构链路协同预测算法研究[J];计算机工程与应用;2017年15期

4 赵德伟;高江锦;徐正巧;;基于链路预测的个性化网络推荐系统研究[J];福建电脑;2017年07期

5 何军;刘业政;;基于多维社交关系的在线社交网络链路预测研究[J];现代情报;2017年07期

6 高杨;张燕平;钱付兰;赵姝;;结合节点度和节点聚类系数的链路预测算法[J];小型微型计算机系统;2017年07期

7 刘竟;孙薇;;基于链路预测的潜在科研合作关系发现研究[J];情报理论与实践;2017年07期

8 张金柱;胡一鸣;;利用链路预测揭示合著网络演化机制[J];情报科学;2017年07期

9 赵晓婧;刘子嘉;;基于三阶路径的链路预测新指标[J];晋中学院学报;2017年03期

10 闵波;张莉;杨帆;雷权;张云宏;;联系强弱对生物医学文献知识发现的影响[J];医学信息学杂志;2017年05期

【相似文献】

相关期刊论文 前10条

1 杨云;称球问题的一个启发式规则[J];微型电脑应用;1999年10期

2 战德臣,陈伟,王忠杰;基于启发式规则的混合遗传算法及其在生产计划优化中的应用[J];计算机工程与应用;2003年08期

3 李楠;郑荣廷;吉久明;滕青青;;基于启发式规则的中文化学物质命名识别研究[J];现代图书情报技术;2010年05期

4 温蕴;孙亚;;基于启发式规则和蚁群算法的车间作业调度方法[J];计算机应用与软件;2009年06期

5 李斌;郑南;陈瑛琦;;一种用关键乐段对音乐进行检索的方法[J];电脑知识与技术;2010年13期

6 冯雅中,庄越挺,潘云鹤;一种启发式的用哼唱检索音乐的层次化方法[J];计算机研究与发展;2004年02期

7 李豆豆;;生产调度的启发式规则研究综述[J];机械设计与制造工程;2014年02期

8 陈仙桃;胡正华;;基于启发式规则的现货配船算法研究[J];价值工程;2009年12期

9 胡大洋;;基于启发式规则的多记录页面分隔符识别方法[J];软件导刊;2009年09期

10 胡金柱;周星;舒江波;熊春秀;;基于启发式规则的网页主题信息精确定位方法[J];计算机应用研究;2010年02期

相关会议论文 前2条

1 黄亚才;李秀喜;钱宇;;启发式规则在炼油厂短期原油调度模型中的应用[A];2009中国过程系统工程年会暨中国mes年会论文集[C];2009年

2 刘飚;刘艳敏;封化民;方勇;宋国森;;基于新型坐标树的页面分析和内容提取方法[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年

相关硕士学位论文 前2条

1 董静茹;基于链接背景信息的启发式主题爬行[D];吉林大学;2006年

2 谢莹;Deep Web查询结果抽取及注释[D];吉林大学;2010年



本文编号:2142875

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2142875.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1b77c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com