当前位置:主页 > 论文百科 > 学术论文 >

基于内容与引用关系的学术论文推荐

发布时间:2017-09-23 05:40

  本文关键词:基于内容与引用关系的学术论文推荐


  更多相关文章: 学术论文 引用关系图 Steiner-tree 协同过滤


【摘要】:科研文献是科研活动的重要产物,这些科研文献对于促进科研人员间的思想沟通交流起着重要的作用。科技的进步使得学术论文的数量与日俱增,即使在特定领域内,学术论文的数量也是相当庞大的。如何快速找到相关论文是科研人员比较关心的问题之一。传统的基于关键词的检索方式具有一定的局限性,关键词的选择直接影响最后的搜索结果。 学术论文作为一种比较严谨的科技类文献,有其独特的层次结构。合理利用学术论文的结构及内容特征有助于学术论文相关研究的信息处理和归纳。学术论文的结构特点之一是学术论文之间的引用关系。同一研究方向的文章往往引用和参考的也都是紧密相关的文献。由此可见,论文之间的引用关系往往能够体现出论文之间的相关性。 本文结合论文的内容信息和引用关系本身的特性来研究学术论文的推荐问题。本文首先对学术论文进行建模并抽取其内容和结构特征。为了更好的理解学术论文引用关系的基本特征,本文首先对一个较大规模的学术论文数据的引用关系进行了分析和统计。然后本文将Steiner-tree问题与学术论文推荐结合起来,实现了引用关系图上的论文推荐。同时,本文在引用关系图上使用协同过滤的推荐方法来推荐学术论文。针对两种不同的解决方案,我们在R-tree相关和P2P相关的学术论文数据集上设计了不同的实验来验证算法的有效性和可行性。 本文的主要贡献包括以下几个部分: ●学术论文特征抽取:本文针对学术论文严谨的结构特点,将学术论文的结构划分为论文标题、作者信息、主体内容和参考文献列表等部分,然后针对每一部分的特点进行解析和信息抽取,其中论文的参考文献信息是推荐相关论文的一个特别关键的信息。之后我们使用这些信息抽取学术论文的内容和结构特征。 ●基于Steiner-tree的学术论文推荐:本文提出了一种基于Steiner-tree的学术论文推荐方法。本文首先将论文间的引用关系转化成一个带权重的引用关系图,然后将学术论文推荐问题转化为在引用关系图中找Steiner点的问题。 ●基于协同过滤的论文推荐:本文提出了结合协同过滤与论文引用关系的学术论文推荐方法。本文将学术论文间的引用关系转化为协同过滤中的用户-物品的打分矩阵,利用引用关系的特征作为打分的依据。通过找到与目标论文有相近引用偏好的论文作为目标论文的邻居,共享这些邻居论文的引用关系信息,然后将所有邻居对于某篇论文的打分的综合评分作为目标论文对该论文的预测打分。最后按照预测的分值高低顺序返回推荐列表。 ●多组实验验证:本文针对提出的两种学术论文推荐方法,分别设计了详细的实验,验证算法的可行性和准确度并考察了不同参数变化对实验结果的影响。本文使用一个较大规模的真实数据集作为实验数据集,并且对此数据集进行了相关统计和分析。针对基于Steiner-tree的推荐方法,本文设计实验分别考察了查询点个数以及算法执行次数对最终结果的影响。实验结果表明,基于Steiner-tree的推荐方法的结果具有一定的稳定性且在查询点的个数较少时,实验的准确率更高。针对基于协同过滤的推荐方法,本文设计实验考察邻居数量、推荐列表长度、以及不同的打分策略等参数对实验结果的影响。实验结果表明设置合理的邻居个数时,实验的准确率、查全率均能达到一个比较好的取值范围。 综上所述,本文不仅对学术论文进行建模,抽取其内容和结构特征,同时也提出了两种基于引用关系的论文推荐方法,并且设计实验验证算法的可行性。
【关键词】:学术论文 引用关系图 Steiner-tree 协同过滤
【学位授予单位】:华东师范大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP391.3
【目录】:
  • 摘要6-8
  • ABSTRACT8-12
  • 第一章 绪论12-17
  • 1.1 研究背景12-13
  • 1.2 本文工作与贡献13-16
  • 1.3 本文结构16-17
  • 第二章 相关工作17-31
  • 2.1 科学文献管理与分析系统17-19
  • 2.2 科学文献研究推荐19-22
  • 2.3 推荐方法22-27
  • 2.4 Steiner-tree27-31
  • 第三章 问题描述31-40
  • 3.1 学术论文建模31-35
  • 3.2 引用关系图35-36
  • 3.3 Steiner-tree与学术论文推荐36-37
  • 3.4 协同过滤与学术论文推荐37-38
  • 3.5 结果衡量标准38-39
  • 3.6 本章小结39-40
  • 第四章 学术论文推荐40-52
  • 4.1 引用关系图数据40-46
  • 4.2 特征分析与选择46-47
  • 4.3 基于最小Steiner-tree的推荐47-49
  • 4.4 基于协同过滤的推荐49-50
  • 4.5 本章小结50-52
  • 第五章 实验52-67
  • 5.1 实验设定与准备52-57
  • 5.2 基于Steiner-tree的实验57-59
  • 5.3 基于协同过滤的实验59-67
  • 第六章 总结与展望67-70
  • 参考文献70-78
  • 附录A CiteSeerX数据示例78-79
  • 附录B OAI-PMH动词意义及其参数设置79-80
  • 致谢80-82
  • 攻读硕士学位期间发表论文和科研情况82

【共引文献】

中国期刊全文数据库 前10条

1 冀俊忠,沙志强,刘椿年,郎青;B2C电子商务站点中知识发现的研究[J];北京工业大学学报;2003年02期

2 高玲玲;李伟生;;一种新的动态QoS多播路由启发式算法[J];北京邮电大学学报;2006年S1期

3 张帆;林建;;智能搜索引擎信息过滤机制研究[J];图书与情报;2007年04期

4 何兴无;;用户兴趣实例模型与K_means算法的改进[J];重庆师范大学学报(自然科学版);2006年02期

5 曹毅;罗新星;;电子商务推荐系统关键技术研究[J];湘南学院学报;2008年05期

6 王兴伟;侯美佳;易秀双;黄敏;;NGI中的一种禁忌-递阶遗传QoS组播路由算法[J];东北大学学报;2006年05期

7 岳承君;井元伟;李庆奎;;链路优化时延约束组播路由的遗传算法[J];东北大学学报(自然科学版);2007年04期

8 庄昌文,范明钰,李春辉,虞厥邦,黄劲;一种串扰和时延驱动的总体布线算法[J];电子科技大学学报;2000年03期

9 朱郁筱;吕琳媛;;推荐系统评价指标综述[J];电子科技大学学报;2012年02期

10 余燕平,赵问道,孟利民,仇佩亮;基于关键节点和多播节点的多播路由算法[J];电路与系统学报;2003年02期

中国重要会议论文全文数据库 前8条

1 高玲玲;李伟生;;一种新的动态QoS多播路由启发式算法[A];2006年全国通信软件学术会议论文集[C];2006年

2 张晓瑜;张光昭;张琳;;一种overlay network的组播路由算法[A];第二届和谐人机环境联合学术会议(HHME2006)——第15届中国多媒体学术会议(NCMT'06)论文集[C];2006年

3 ;Solving the Problem of the Link Optimizing and Delayconstrained Multicast Routing Based on GA[A];第25届中国控制会议论文集(下册)[C];2006年

4 赵琦;骆志刚;田文颖;李聪;丁凡;;一种基于负反馈信息的用户兴趣模型修正方法[A];中国通信学会第六届学术年会论文集(下)[C];2009年

5 魏宏;胡明;孟洛明;;光传送网络中环路组播算法及实现[A];第六届全国计算机应用联合学术会议论文集[C];2002年

6 岳承君;井元伟;;不确定信息QoS路由的概率遗传算法的研究[A];中国系统仿真学会第五次全国会员代表大会暨2006年全国学术年会论文集[C];2006年

7 孙晓飞;张强;;物流配送中心选址的多目标优化模型[A];第十二届中国管理科学学术年会论文集[C];2010年

8 曹宇;胡文敏;;组播路由技术综述[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年

中国博士学位论文全文数据库 前10条

1 张寅;个性化技术及其在数字图书馆中应用的研究[D];浙江大学;2009年

2 刘卓;无线传感器网络拓扑建立方法与应用技术研究[D];华中科技大学;2011年

3 靳延安;社会标签推荐技术与方法研究[D];华中科技大学;2011年

4 胡慕海;面向动态情境的信息推荐方法及系统研究[D];华中科技大学;2011年

5 郭龙坤;基于不相交路径技术的可靠网络设计[D];中国科学技术大学;2011年

6 刘毅捷;视频社区中海量数据管理方法研究[D];中国科学技术大学;2011年

7 赵衍才;图的某些控制参数的计算[D];上海大学;2011年

8 刘玉国;基于内容的互联网舆情信息挖掘关键技术研究[D];山东大学;2011年

9 马春山;移动增值业务的个性化推荐研究[D];北京邮电大学;2011年

10 夏培勇;个性化推荐技术中的协同过滤算法研究[D];中国海洋大学;2011年

中国硕士学位论文全文数据库 前10条

1 吴则则;支持动态演进的用户兴趣模型挖掘方法研究[D];山东科技大学;2010年

2 何莹杰;个性化图书信息服务技术研究[D];哈尔滨工程大学;2010年

3 李媛;电子商务个性化推荐关键技术研究[D];哈尔滨工程大学;2010年

4 杨宁;应用层多播与Steiner算法的研究[D];大连理工大学;2010年

5 李春;协同过滤推荐算法的研究[D];湘潭大学;2010年

6 韩璐;针对推荐系统中信息共享需求下隐私保护机制的研究与实现[D];华东师范大学;2011年

7 宋健;基于主题挖掘和时间窗口划分的兴趣推荐技术研究[D];华东师范大学;2011年

8 金亚亚;一种基于改进信任度的协同过滤算法[D];华东理工大学;2011年

9 夏超伦;基于社会计算的电子商务协同过滤推荐算法研究[D];浙江大学;2011年

10 郑佳佳;社交网络中基于图排序的好友推荐机制研究与实现[D];浙江大学;2011年



本文编号:903529

资料下载
论文发表

本文链接:https://www.wllwen.com/wenshubaike/lwzy/903529.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户54c14***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com