当前位置:主页 > 社科论文 > 图书档案论文 >

基于论文特征进行高Usage文献的识别

发布时间:2020-11-08 11:16
   被引频次是学术论文评价中应用最广泛的指标,与此同时,学者对网络平台论文的下载、点击,等其他效用指标的关注也越来越多,WoS平台发布的的学术用量级指标Usage,在论文评价领域提出了新视角。本研究从论文作者、发表的期刊、所在研究机构等外在因素和论文篇幅、作者数量、参考文献数量等内在因素两方面对比分析高低Usage论文的异同,并尝试通过机器学习的方法实现高Usage论文的预测,以探索高Usage论文的成因。本研究以WoS数据库2013年发表的“COMPUTER SCIENCE ARTIFICIAL INTELLIGENCE”学科下的11008篇论文的题录信息作为原始数据;按照Usage指标降序排序,选取前5%共550篇论文作为高Usage论文集;下载全记录格式的题录信息作为高Usage论文数据集,另外按照发布时间排序取并排除掉高Usage论文的550篇文献,下载全记录格式的题录信息,作为低Usage论文数据集。全部数据下载时间为2018年11月,最终获得1100篇论文的题录信息作为原始数据,然后根据作者机构和期刊的信息,分别在WoS平台的ESI数据库和JCR年度报告中获取论文的机构和期刊的指标数据。研究发现:(1)论文自身特征:两种论文合著率均比较高,高Usage论文的参考文献数量明显大于低Usage论文,而作者数量、论文篇幅,两种论文集不存在显著差异。(2)论文作者:无论是作者的发文量、h指数、还是总被引频次,低Usage论文作者相比于高Usage论文作者,明显处于弱势。(3)论文所在机构:两种论文所在机构在发文量、总被引频次、被引频次/发文量上均不存在显著性差异。这一点与论文作者量化指标不同,作者所在机构的影响力对论文Usage的影响远没有上升到显著水平。(4)高Usage论文所在期刊的总被引频次明显高于低Usage论文所在期刊;在被引半衰期和引用半衰期上高Usage论文也略高一些,但影响因子JIF、发文量、以及文章影响值两种论文不存在显著差异。结果表明,高Usage论文主要集中在,参考文献多,研究基础扎实,作者影响力大,期刊影响力大,引用较新,老化速度较慢的期刊。(5)对比发现CHAID决策树分类模型对Usage指标预测效果最好,模型匹配度较高,在测试集上预测准确率都达到84%以上。
【学位单位】:华东师范大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:G353.1
【文章目录】:
摘要
ABSTRACT
第一章 绪论
    第一节 研究背景
    第二节 研究目的和研究意义
        一、研究目的
        二、研究意义
    第三节 研究现状
        一、使用数据的相关研究
        二、论文价值影响因素相关研究
    第四节 研究思路和论文结构
        一、研究思路
        二、论文结构
    第五节 研究方法
第二章 数据收集及相关指标定义
    第一节 数据收集
        一、研究论文集的收集
        二、特征指标数据收集
    第二节 相关指标定义
第三章 影响Usage指标的论文特征分析
    第一节 论文自身特征分析
        一、论文作者数量分析
        二、论文篇幅分析
        三、论文参考文献数量分析
        四、论文被引频次分析
        五、小结
    第二节 论文作者分析
        一、作者量化指标分析
        二、小结
    第三节 论文所在机构分析
        一、论文机构量化指标分析
        二、机构发文量分析
        三、机构总被引频次分析
        四、机构被引频次/发文量分析
        五、小结
    第四节 论文所在期刊分析
        一、期刊特征指标分析
        二、小结
    第五节 本章小结
第四章 高Usage论文预测
    第一节 贝叶斯分类预测
        一、贝叶斯分类方法原理
        二、建模过程
        三、预测输出
    第二节 回归分类预测
        一、回归分类原理
        二、建模过程
        三、预测输出
    第三节 支持向量机分类预测
        一、支持向量机分类原理
        二、建模过程
        三、预测输出
    第四节 人工神经网络分类预测
        一、人工神经网络分类原理
        二、建模过程
        三、预测输出
    第五节 决策树分类预测
        一、决策树分类原理
        二、建模过程
        二、预测输出
    第六节 结果分析
    第七节 本章小结
第五章 结论与展望
    第一节 研究结论
    第二节 建议实施
    第三节 研究创新点
    第四节 研究不足与展望
参考文献
作者在学期间所取得的科研成果
后记

【相似文献】

相关期刊论文 前10条

1 王会生,赵柏儒,陆勇,张鹰子,袁彩文,史引焕,赵玉英,高炬,李林;MICROSTRUCTURE AND CRITICAL CURRENT OF ORIENTATED YBaCuO THIN FILMS[J];Chinese Science Bulletin;1989年05期

2 ;Meet Our Rare Earther[J];China Rare Earth Information;1989年02期

3 ;Metal Tailings Produces Output Value of Tens of Billions[J];China Nonferrous Metals Monthly;2010年06期

4 Fiorenza Gracci;赵蕴哲;;任重而道远的“禁塑令”[J];法语学习;2016年06期

5 ZHAO Xing;;Exploring the measurement features of usage data for academic literature[J];Journal of Library Science in China;2017年00期

6 石进;;对高中英语“Grammar and usage”展示课的反思[J];广西教育;2014年42期

7 Ping YU;Fei YANG;Chun CAO;Hao HU;Xiaoxing MA;;Mining API usage change rules for software framework evolution[J];Science China(Information Sciences);2018年05期

8 Nelson Oly NDUBISI,Omprakash K.GUPTA,Samia MASSOUD;ORGANIZATIONAL LEARNING AND VENDOR SUPPORT QUALITY BY THE USAGE OF APPLICATION SOFTWARE PACKAGES:A STUDY OF ASIAN ENTREPRENEURS[J];Journal of Systems Science and Systems Engineering;2003年03期

9 白英民;;Common usage of “agree”[J];中学生百科;2008年35期

10 ;Preface[J];Journal of Computer Science & Technology;2010年06期


相关博士学位论文 前1条

1 TOUQEER AHMAD;[D];华中农业大学;2013年


相关硕士学位论文 前10条

1 赵楠;基于论文特征进行高Usage文献的识别[D];华东师范大学;2019年

2 郭凤;用法词典研究[D];陕西师范大学;2013年

3 王(王廷);语文词典的语域标注和学科标注[D];厦门大学;2001年

4 熊薇薇;中国学生话语标记词使用状况研究[D];浙江大学;2006年

5 刘亚倩;[D];西安外国语大学;2016年

6 廖晓妍;基于语料库对19、20世纪美国小说中虚拟语气的对比研究[D];大连海事大学;2008年

7 罗娟;手机在中国的使用和人际关系[D];广东外语外贸大学;2005年

8 冯婷;英汉学习型词典中的用法信息[D];广东外语外贸大学;2009年

9 安中彦;心智哲学视域下网络语言生成机理初探[D];山西财经大学;2016年

10 冯丽琪;汉英词典中用法标签的一种探索[D];厦门大学;2008年



本文编号:2874710

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/2874710.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1e915***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com