基于引文网络图模型的论文推荐系统研究与应用

发布时间:2020-11-06 06:14
   由于当前科研的不断发展,大量论文的出现使得科研工作者在进行论文研读时会产生一定的困扰,论文推荐系统可以很好的解决此类问题。因此本文提出了基于三层引文网络的图模型以及相应推荐算法。在三层引文网络图模型中结合了论文内容特征信息、论文引用关系、作者的合著关系以及论文的研究领域信息多种论文特征。本文主要研究工作如下:(1)对论文推荐系统以及相应算法进行一定的研究,了解相关领域的研究现状并进行综述。总结论文推荐系统以及引文网络中的理论信息,为后续的模型构建、算法应用以及推荐系统的实现做好理论基础。(2)构建了三层引文网络图模型。目前,大多数引文网络模型仅采用单一特征模型且未涉及到论文的研究领域信息。因此,本文将论文引用关系、论文内容特征信息、作者合著关系以及论文研究领域信息融入到该模型中。利用AMiner上的DBLP-Citation-network数据集,首先提取数据集中论文、作者以及研究领域信息;其次根据论文之间的引用关系建立论文引用网络,根据作者之间的合著关系建立作者合著网络;最终根据三者的关联关系建立三层引文网络图模型。生成的三层引文网络图模型将作为后续算法和推荐系统原型实现的数据模型基础。(3)提出了基于三层引文网络模型的论文推荐算法。将上述提出的三层引文网络图模型与重启随机游走算法相融合,形成本文的论文推荐算法(PAFRWR)。本文通过recall@N与NDCG@N的值作为评价指标值,首先对比不同重启概率下的评价指标值,确定了PAFRWR的重启概率参数=0.3。再通过对不同搜索向量的实验对比,确定当搜索向量包含论文、作者和研究领域三重信息时,评价指标更高。最后,将PAFRWR算法与PageRank、LDA和Link-PLSA-LDA进行对比实验,实验结果表明,PAFRWR算法的评价指标值优于其他三种方法。(4)设计并实现了基于三层引文网络模型的论文推荐原型系统。结合本文提出的模型和算法,介绍系统整体框架以及主要模块设计,本系统采用Python语言进行系统开发,借助XmlRPC模型,将推荐模型转化为RPC服务,最终通过以上技术实现该系统。
【学位单位】:云南师范大学
【学位级别】:硕士
【学位年份】:2020
【中图分类】:TP391.3
【部分图文】:

网络图,会期,作者,物理学


第2章相关理论与技术13“小世界网络”等。图2.2美国物理学会期刊APS上作者发表论文的作者引用网络[49]复杂网络的度量标准主要根据图论中的相关理论,下面将介绍复杂网络中涉及到的部分内容:图中节点的度、常见的复杂网络模型以及复杂网络在现实生活中的应用。1.复杂网络的表示形式复杂网络的数学框架是以图论为基础的,复杂网络理论中的网络就是图,图的顶点在复杂网络理论中称为节点,图的边在复杂网络中称为连结。在复杂网络结构中,复杂网络可以由节点与连结所组成的图来表示[50]。通常可以采用数组、邻接矩阵、关联矩阵、多重链表等方式来表示。若一个图中节点与节点之间有边连接,且边没有方向即无序对(,)和(,)表示的是同一条边,则该网络图就是无向网络图,否则该网络图为有向网络图。对于任意图通常采用关联矩阵来表示节点与边之间的关系,用邻接矩阵来表示节点之间的关系。设1,2,3,…,与1,2,3,…,分别来表示图的顶点与边,则()=[]为图的关联矩阵,其中是和相关联的次数。()=[]为图的邻接矩阵,其中是与之间连接边的个数[47]。在网络图中,根据节点之间是否存在连接关系,可以分为有权网络和无权网络。也可通过矩阵来表示两节点之间存在的连接关系,如公式2.1,其中用来

过程图,网络模型,形式,过程


第2章相关理论与技术16如图2.3,通过调节一个参数使得模型从规则网络模型向随机网络模型进行转变。P=0时为规则网络;=1为随机网络;在0<<1时,该网络就是小世界网络,其具有较短的平均路径长度且有较大的簇系数的特点,存在一定的聚集性[52]。图2.3三种网络模型形式及转变过程[51]WS小世界模型的构造过程如下:首先根据规则性的特点,从一个环状的具有个节点的规则网络开始,网络中的每个节点与它最近邻的m个节点相连接,其中m为偶数。再根据随机性的特点,以概率随机地将网络中的每条边进行重连,保证网络中任意两个不同节点之间至多只能有一条边相连,且每个节点不能自连产生环。5.复杂网络的应用在现实生活中,网络关系在不断的生成扩展中,例如互联网络、人际网络、论文引用网络、交通网络等等。目前复杂网络多用于网络传播分析,例如网络病毒传播、互联网信息传播等方。通过对复杂网络模型的研究,改进已有模型结构,解决已有问题;并利用复杂网络结合多个领域,例如信息技术领域、生物领域、工程技术领域等,实现各领域的交叉研究。在本文中,将复杂网络应用于个性化推荐场景中,利用论文引用网络为用户推荐其感兴趣的论文结果。2.4基于引文网络推荐的相关算法2.4.1基于引文网络的推荐方法本小节将介绍基于引文网络推荐的5种常用的模型方法。

网络图,数据,例子,论文


第3章三层引文网络图模型构建25机器解析来说也更加容易。JSON包含两种数据结构类型:对象和数组。对象是中间部分由零个或多个无序的关键字(key)和值(value)构成的,例如{"id":"013ea675-bb58-42f8-a423-f5534546b2b1","year":2017}表示一个对象。而数组是由了零个或多个值列表组成,例如{"authors":["LeonA.Sakkal","KyleZ.Rajkowski","RogerS.Armen"]}表示一个数组。相对于XML而言,JSON具有以下的优点:其一JSON的编码难度相对简单,可以不借助其他工具进行编码,且JSON的解析难度也很低,更适合于数据交换处理;其二JSON数据体积较小,传输的速度较快。下面是DBLP-Citation-network数据集中一条JSON格式的论文数据举例:图3.1一条JSON数据例子这条数据是在JournalofComputationalChemistry上2017年发表的文章,其中id为论文id作为每条数据的唯一标识符;authors为论文的共同作者;reference为该论文的参考文献,以论文id存储;n_citation为该论文的被引次数;title为论文的标题。3.2.3数据集预处理1.数据清洗
【参考文献】

相关期刊论文 前6条

1 陈海华;孟睿;陆伟;;学术文献引文推荐研究进展[J];图书情报工作;2015年15期

2 吴海峰;孙一鸣;;引文网络的研究现状及其发展综述[J];计算机应用与软件;2012年02期

3 李稚楹;杨武;谢治军;;PageRank算法研究综述[J];计算机科学;2011年S1期

4 石杰;申德荣;聂铁铮;寇月;于戈;;一种基于多因素的引文推荐方法[J];计算机研究与发展;2011年S3期

5 李冰;;图论的起源和发展[J];大众文艺;2010年09期

6 党亚茹;引文网络系统的结构模型化[J];图书情报工作;1996年04期


相关博士学位论文 前1条

1 孙见山;科研社交网络中的论文推荐[D];中国科学技术大学;2014年


相关硕士学位论文 前10条

1 孟伟龙;基于图模型的论文推荐系统设计与实现[D];西北农林科技大学;2019年

2 赵桓幜;基于异构信息网络的引文推荐方法研究[D];安徽大学;2019年

3 陈浩;基于协同过滤算法的论文推荐系统研究与设计[D];武汉科技大学;2018年

4 李飞;基于文本向量表示学习的引文推荐方法研究[D];西北农林科技大学;2018年

5 陈志涛;基于深度学习的个性化引文搜索推荐算法研究[D];西北农林科技大学;2018年

6 陈金鹏;基于多兴趣的学术论文推荐研究[D];内蒙古大学;2017年

7 王冬晖;基于内容的计算机科学论文推荐系统设计与实现[D];吉林大学;2017年

8 马丙超;基于引文网络的文献在线推荐系统研究和实现[D];大连理工大学;2016年

9 单晓菲;基于二部图的推荐算法研究[D];南京航空航天大学;2015年

10 倪卫杰;基于用户兴趣模型的个性化论文推荐系统研究[D];天津大学;2010年



本文编号:2872761

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/2872761.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0b317***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com