当前位置:主页 > 社科论文 > 图书档案论文 >

基于新颖性和影响力的论文推荐方法研究

发布时间:2024-06-30 04:21
  随着网络技术的飞速发展,网络信息资源呈爆发式增长趋势,其中的学术论文等资源的数量也急剧增长。据DBLP数据统计,自2010年以来每年平均有超过33.6万篇的论文发表,仅人工智能领域,2000年到2019年期间在ar Xiv上发表的学术论文数量增长了20倍以上。如何在海量数据中实现更精准的论文搜索和推荐,成为当前相关研究领域的一个重点和难点问题。据不完全统计,在学术类论文的搜索目标中,大多数用户对论文的理论创新度有很高的关注度,而传统的论文搜索和推荐算法主要采用在全文范围内基于上下文环境或语义的关键词匹配查询或者基于用户兴趣模型的相关推荐等方式,这些推荐算法推荐的论文质量参差不齐且存在大量重复和冗余,增加了用户查阅的难度,也降低了用户的查阅效率,难以满足用户的查询需求。因此,本文提出了一种基于新颖性和影响力的论文推荐算法。主要的研究工作如下:(1)提出了一种基于主题共现图的论文新颖性检测算法,使用主题共现图来模拟论文思想与领域知识背景之间的关系,提取背景图的变化作为论文新颖性检测模型的特征集,然后使用自编码神经网络与密度聚类相结合的方法来检测一篇论文的新颖程度并给出是否新颖的可靠性判断。...

【文章页数】:61 页

【学位级别】:硕士

【部分图文】:

图2-1LDA模型

图2-1LDA模型

第二章相关技术理论介绍11第二章相关技术理论介绍2.1LDA主题模型LDA(LatentSemanticAnalysis)是一种概率主题模型,在自然语言处理中常被用于挖掘海量文档集合或语料库中的潜在的主题信息以及归属于这些主题的单词分布情况。LDA模型中包含三个层次,自上而下分别....


图2-2自编码神经系统结构

图2-2自编码神经系统结构

华南理工大学硕士学位论文12Step2:从狄利克雷分布β中为每个主题抽取对应的单词分布矩阵。Step3:文档i中的单词将根据下面步骤逐步生成,重复下面步骤直到该篇文档抽取完毕:1)从主题分布矩阵iθ中抽样生成目标单词j所对应的的主题jiz,2)从单词分布矩阵中取样生成目标单词ji....


图2-3Word2vec模型

图2-3Word2vec模型

华南理工大学硕士学位论文14单词的语义特征,而向量与向量之间的距离了则表示了单词之间的语义相似度。Word2vec主要包括Skip-gram和CBOW(ContinuousBag-of-WordsModel)两种模型。模型结构如图2-3所示。两种模型都是三层神经网络模型,其包括输....


图3-1图形变化特征提取过程

图3-1图形变化特征提取过程

第三章基于主题共现图的论文新颖性检测方法研究19图3-1图形变化特征提取过程其中,背景图是表示先前观察到的所有论文的主题共现图。论文图是表示一篇论文构建的主题共现图。然后提取在添加过程中论文的主题共现图与当前背景图结合所产生的变化特征。当添加完一篇论文之后,该论文的主题共现图与当....



本文编号:3998380

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/3998380.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c203e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com