当前位置:主页 > 社科论文 > 图书档案论文 >

基于机器学习的论文学术创新力评价研究

发布时间:2020-06-21 01:53
【摘要】:论文作为科学研究成果的一种形式,在学术交流和科学发展中发挥着重要的作用。为了把握最前沿的科研动向,科研工作者需要从大量文献中发现具有创新力的论文,并且对其进行参考和借鉴。对论文的学术创新力进行评价有助于促使科研工作者和科研机构从事更前沿的研究,从而促进科学的发展。同时,论文学术创新力评价的结果能指导科技政策的制定、职位评级和资源分配等。目前,论文的学术创新力评价方法主要分为两类:以同行评议方(?)要手段的定性评价法和基于文献计量学的定量评价法。在定性评价法中,同行评议存在着主观性强、周期长、成本高的缺点,该方法对于大量文献的评价更是效率低下。定量评价法主要包括单个特征指标评价法、以影响力测度创新力法、指标体系评价法、基于论文内容的评价法和构造创新力评价指标法,每种方法都存在一定的局限性。机器学习是信息时代的发展产物,通过对多维特征数据的学习和理解,能以一种自适应的方式实现对论文学术创新力的评价,有望解决定性评价和定量评价中的缺陷。因此,用机器学习的方法对论文的学术创新力进行评价成为一个新的研究方向。本文基于机器学习方法对论文的学术创新力进行评价。主要研究内容包括:(1)提取学术创新力相关的特征指标,构建创新力评价指标体系;(2)探究指标体系中单个特征与创新力之间的相关关系,分析单个特征对学术创新力的作用机制;(3)构建并检验提出的机器学习模型(多元线性回归模型、回归树、随机森林、神经网络模型),选择性能最好的模型对论文的学术创新力进行评价;(4)使用回归树模型和随机森林模型分析特征的重要性,剔除与学术创新力无关的特征,对原始评价指标体系进行更正。实验结果表明,本文构建的论文学术创新力评价指标体系是合理的,基于机器学习能够快速、有效地对论文的学术创新力进行评价。在所选取的模型中,神经网络模型的评价效果最好。通过对特征重要性的分析,发现在原始指标体系中合著因素、基金等级等五个特征与学术创新力无关,基于此对指标体系进行更正。本文的研究为学术创新力评价提供了一个新视角,得到的学术创新力评价指标体系及特征的重要性可为后续的研究提供指导和方向。
【学位授予单位】:南京大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:G353.1
【图文】:

论文,引证文献,测度法,学术创新


y=邋^ ̄COSj逦(2-3J'邋 ̄J邋I逡逑位足个连续值,该值越大,论文的创新力越大。逡逑动态网络测度法逡逑1481基于论文的引文结构构造了创新力的测度指标,该论文认为,虽能完全代表创新力的大小,但可以通过引用结构测度创新。图是论构图,在图中,中间的灰色方块代表论文,左边的圆形代表论文参合,右边较大的圆形代表论文的引证文献集合。根据引用结构,引类:图中绿色的方框表示引证文献既引用了论文i又引用了论文的参红色方框表示引证文献只引用了论文i,蓝色方框表示引证文献只引参考文献j。逡逑.

论文,作者,学术创新,引证文献


逦novlty逡逑图4-1论文的创新力值逦图4-2论文创新力的区间分布逡逑4.1.3学术创新力评价的特征值计算逡逑对于单篇论文,从CNKI中可以获取到论文的作者、作者所在的单位、摘逡逑要、基金名称、分类号、参考文献的数量、被引频次等信息,同时奇以获取到逡逑所有参考文献、引证文献的具体信息,对于论文的每个作者也能获取到作者的逡逑研宄方向、发文数量等。由于本文选取的论文数据量大,特征难以直接提取,逡逑所以采用Python爬虫的方式获得了需要的字段。在所有的22个特征中,有些特逡逑征数值是可以从CNKI中直接获取到或者根据基本字段信息进行简单计算得到逡逑的,有些特征需要经过比较复杂的处理才能获取。易获取到的字段信:息在表格逡逑4-1中(以“电子商务中在线评论内容对评论有用性影响的实证研宄”这篇文章逡逑为例)。逡逑需要注意的是,与作者相关的指标信息不能直接从CNKI中获取,原因是逡逑有可能存在不同领域或者不同机构同名的作者

【相似文献】

相关期刊论文 前10条

1 刘传会;汪小亚;郭增辉;;机器学习在反洗钱领域的应用与发展[J];清华金融评论;2019年04期

2 李兵;林文钊;罗峥尹;;基于机器学习的智慧农业决策系统设计与实现[J];信息与电脑(理论版);2018年24期

3 舒娜;刘波;林伟伟;李鹏飞;;分布式机器学习平台与算法综述[J];计算机科学;2019年03期

4 朱辉;;机器学习在企业级场景中的实践与探讨[J];中国建设信息化;2018年03期

5 彭传意;;机器学习——我们该如何与机器竞争[J];数字通信世界;2018年01期

6 陈轶翔;埃里克·布伦乔尔森;汤姆·米切尔;;机器学习的能力范围及其对劳动力的影响[J];世界科学;2018年04期

7 赵长林;;机器学习即服务[J];网络安全和信息化;2017年10期

8 ;机器学习作用于信息安全的五大顶级案例[J];网络安全和信息化;2018年01期

9 吴承杨;;2018年来说说机器学习[J];软件和集成电路;2018年05期

10 宋雯博;;大数据下的机器学习的应用趋势[J];电脑迷;2018年09期

相关会议论文 前10条

1 王珏;;归纳机器学习[A];2001年中国智能自动化会议论文集(上册)[C];2001年

2 王衍鲁;张利会;张淑洁;石洁茹;王鹏;;大学新生学校适应的个体与环境因素探究:基于机器学习的考察[A];第二十届全国心理学学术会议--心理学与国民心理健康摘要集[C];2017年

3 张长水;;大数据机器学习[A];2015年中国自动化大会摘要集[C];2015年

4 何琳;侯汉清;;基于标引经验和机器学习相结合的多层自动分类[A];2005年中国索引学会年会暨学术研讨会论文集[C];2005年

5 李刚;郭崇慧;林鸿飞;杨志豪;唐焕文;;基于词典法和机器学习法相结合的蛋白质名识别[A];大连理工大学生物医学工程学术论文集(第2卷)[C];2005年

6 徐礼胜;李乃民;王宽全;张冬雨;耿斌;姜晓睿;陈超海;罗贵存;;机器学习在中医计算机诊断识别系统中的应用思考[A];第一届全国中西医结合诊断学术会议论文选集[C];2006年

7 吴沧浦;;智能系统与机器学习的新领域[A];西部大开发 科教先行与可持续发展——中国科协2000年学术年会文集[C];2000年

8 蔡健平;林世平;;基于机器学习的词语和句子极性分析[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

9 吴娜;刁联旺;;基于机器学习的博弈对抗模型优化框架软件系统设计[A];第六届中国指挥控制大会论文集(上册)[C];2018年

10 蒋雍建;程楠;刘泽佳;周立成;汤立群;刘逸平;蒋震宇;;基于响应统计特征和机器学习的桥梁损伤识别方法研究[A];2018年全国固体力学学术会议摘要集(下)[C];2018年

相关重要报纸文章 前10条

1 Isaac Sacolick 编译 Charles;关于机器学习的5个要点[N];计算机世界;2019年

2 记者 张梦然;全新算法助机器学习抵抗干扰[N];科技日报;2019年

3 惠赞瑾;《科学向左,科幻向右》:机器学习即将成为现实[N];中国会计报;2019年

4 CIO.com资深作家 Clint Boulton 编译 Charles;领先一步:机器学习的10个成功案例[N];计算机世界;2018年

5 Bob Violino 编译 Charles;盲目冒进:机器学习的5个失败案例[N];计算机世界;2018年

6 本报驻波士顿记者 侯丽;深入挖掘机器学习潜力[N];中国社会科学报;2019年

7 王方 编译;菌自何方 机器学习早知道[N];中国科学报;2019年

8 Matt Asay 编译 Monkey King;为什么机器学习没有捷径可循?[N];计算机世界;2019年

9 本报记者 操秀英;当量子计算遇到机器学习会碰撞出什么火花?[N];科技日报;2019年

10 彭博企业数据业务全球负责人 Gerard Francis;金融数据质量决定机器学习时代的投资回报[N];计算机世界;2019年

相关博士学位论文 前10条

1 Kashif Sultan(克希夫);5G移动通信网络中的呼叫记录分析[D];北京科技大学;2019年

2 王磊;基于机器学习的药物—靶标相互作用预测研究[D];中国矿业大学;2018年

3 张庆;钙钛矿型功能材料的基因组工程研究[D];上海大学;2018年

4 管月;医学肿瘤影像分类算法研究及其在肝癌上的应用[D];南京大学;2018年

5 郝小可;基于机器学习的影像遗传学分析及其应用研究[D];南京航空航天大学;2017年

6 施建明;基于机器学习的产品剩余寿命预测方法研究[D];中国科学院大学(中国科学院遥感与数字地球研究所);2018年

7 陈再毅;机器学习中的一阶优化算法收敛性研究[D];中国科学技术大学;2018年

8 陆海进;Zr合金热动力学研究及机器学习[D];上海大学;2018年

9 戴望州;一阶逻辑领域知识与机器学习的结合研究[D];南京大学;2019年

10 张庆庆;基于机器学习的文本情感分类研究[D];西北工业大学;2016年

相关硕士学位论文 前10条

1 肖锋;基于迁移学习和在线学习的网络流量分类方法研究[D];哈尔滨理工大学;2016年

2 林炜;基于机器学习的量化择时与量化选股方法研究[D];厦门大学;2017年

3 杜宇梅;政策不确定性与公司长期投资[D];厦门大学;2017年

4 千跃奇;机器学习与自由电子激光的应用研究[D];中国科学院大学(中国科学院上海应用物理研究所);2019年

5 洪镇宇;基于机器学习的跨站脚本攻击检测研究[D];厦门大学;2018年

6 吕沛;机器学习语境下的图像生成艺术研究[D];中央美术学院;2019年

7 Karina Alejandra Espinel Cobos;基于机器学习方法的预测效果分析:1998—2016年中国上市公司退市的证据[D];厦门大学;2018年

8 程大卫;机器学习程序错误分析及其检测技术研究[D];南京大学;2019年

9 杨飒然;基于机器学习理论的线上用户再购买行为的预测模型[D];天津大学;2018年

10 张公铎;非中心化分布式机器学习中的通信优化[D];南京大学;2019年



本文编号:2723308

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/2723308.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1ae34***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com