科技期刊引文评价主流指标对比-分类及综合研究

发布时间：2016-05-12 17:09

第一章绪论

1.1 研究背景
期刊评价最早可追溯至 20 世纪 30 年代英国著名的文献学家 Bradford BC 提出的“布拉德福定律”，揭示了论文在科学期刊中的分布规律，由此拉开了期刊评价的研究序幕。20 世纪 50~60 年代 Price DS 深入研究文献随时间变化的规律，得出文献增长与时间成指数函数的“普赖斯曲线”以及衡量文献老化速度的“普赖斯指数”，推动了科技期刊的评价研究。
但期刊的发文量只能反映期刊产出论文的能力，无法体现期刊发表论文的质量，于是引文分析法应运而生并繁荣至今。显然，文献被引用的次数越高，越能反映该文献的重要性和学术价值。起初，文献计量学家们从期刊的总被引频次、篇均被引频次、引用半衰期等“引文数量”的角度开始研究期刊评价，但“引文数量”的增长受期刊发文量、发表周期、引用行为等多种因素的影响，不能体现引文质量，进而不能很客观地代表科技期刊的质量。
国内科技期刊评价结合了中国科技期刊的实际情况，引入了具有中国特色的评价指标，如基金论文比、论文地区分布等，但在引文评价指标方面，主要还是使用期刊的 IF、总被引频次、II、被引半衰期等，国外近些年开发的指标 h 指数、ES、SJR 和 SNIP 在国内还未被广泛应用。如中国科学技术信息研究所每年发布的《中国科技期刊引证报告》(Chinese Journal Citation Report, CJCR)是我国最权威的期刊质量评价报告之一，它选择总被引频次、IF、II、被引半衰期、论文地区分布、基金论文数和自引总引比作为期刊评价指标。中国科学评价研究中心、武汉大学图书馆和中国科教评价网联袂研发的《中国学术期刊评价研究报告》(A Report on Chinese Academic Journals Evaluation, RCCSE)根据各学术期刊的基金论文比、总被引频次。

……

1.2 研究指标的选择
从科技期刊引文评价指标的发展和指标在国内外期刊评价中的应用现状可以看出，在不胜枚举的期刊评价指标中，引文评价指标在期刊定量评价中具有绝对重要的地位。其中，IF 广泛应用于所有国内外期刊的引文评价中，但 IF 又存在很多局限性，因此其在期刊引文评价中的地位备受争议。本课题首先要将 IF 纳入研究范围内，其余指标，通过以下条件进行筛选：
条件一：必须是期刊引文评价指标。web 即年下载率、二次文献转载或收录指标不能代表期刊发表论文的被引用情况，和基金论文比、论文地区分布都不属于期刊引文评价指标，但它们从某种角度也能反映国内期刊的影响力，具有一定意义，但不在本课题讨论范围内。
条件二：必须是兼顾引文数量与质量的复合型指标。总被引频次、引用半衰期、自引率、他引率等传统的引文指标属于简单的引文计量指标，作用明确而单一，数据库常常列出这些指标作为核心指标的参照、信息的补充，也被排除在讨论范围外。
目前，IF 因其计算简便、理论成熟，一直在国内外科技期刊评价方面占据着核心地位，但有关 IF 在引文分析方面的不足在国内外已有大量报道：IF 在计算过程中只统计了引文数量，默认所有的引文具有同样的权重；未能排除自引行为；使用最多的两年 IF 对于那些科研周期较长的学科和论文发表周期偏长的期刊存在不公平；对于极端数值的变化非常敏感；IF 对发文量大的期刊也不公平，因为计算时分母会变大，计算结果偏小；对于英语类和综述类期刊的偏爱等等。

……

第二章指标对比的理论研究

2.1 计算原理
IF 的计算公式：某刊前两年发表所有类型文献在该年的被引证次数/该刊前两年发表可被引文献数，IF5 只是将引文区间从两年延长至五年，其原理都是在一定的时间内某刊发表论文的平均被引率，即篇均影响。h 指数是指某刊所发表的全部论文中最多有 h 篇论文至少被引用了 h 次(h 这个自然数最大)。相比 IF，h 指数更巧妙地将期刊的载文量与引文数结合起来反映期刊论文的影响力。
SJR 和 ES 都是参考了衡量网页重要性的 PageRank 算法，将期刊之间的引用关系视为以期刊为节点、以引用关系为链接的引文网络，通过期刊的引用关系评价期刊的重要性。但两者的具体算法不同。SJR 的计算过程[47]是：先给每本期刊设定同一个 SJR 初值，通过多次的迭代计算直至两次迭代计算之间 SJR 的差值小于事先设定的阈值时，所得的最终结果为目标期刊的 SJR 值。一本期刊的 SJR 值取决于该刊三年内获得的声望，而这种声望来自于期刊引用网络中其他期刊的声望。ES 的计算过程是：先构造以期刊为节点的五年期互引矩阵，然后通过剔除自引、标准化处理、替换无引用悬点、加入阻尼系数 α 后得到随机矩阵 P，再通过迭代计算主特征向量 π，最后带入公式计算 ES[33]。研究者随机选取一本期刊，通过阅读其中的任一参考文献链接到下一本期刊，以此类推，ES 就是计算研究者在这个引文网络中进入某个期刊的几率百分值，也就是计算该网络中期刊被引用的可能性。
由表 2 可见，ES 的离散程度最高，h 指数的离散程度最低，并且 ES 取值小数点后五位，h 指数为整数三位以内，h 指数同值几率高，不容易显示期刊之间的微弱差距，而 ES 更能敏锐地区分期刊。

科技期刊引文评价主流指标对比-分类及综合研究

……

2.2 特点对比
IF 最初是美国 ISI 的期刊引证报告(JCR)中的一项数据，由于其计算原理简单，现已在国内外各领域广泛使用。h 指数只需通过简单排序计算，在国外已应用于各大数据库。SJR、ES 和 SNIP 由于计算过程复杂，出现时间短，其应用还仅局限与各自的来源数据库。SJR 和 SNIP 基于 Scopus 数据库的数据，而 ES 基于 WoS 数据库。Scopus 数据库每日更新，目前共有 5000 万条记录，其中 1996 年后有 2900 万条记录，1995 年前的记录可追溯到 1823 年。WoS 数据库每周更新，收录了 12,000 多种期刊，基本囊括了世界范围内有重要影响力的刊物。WoS 数据库注重精品期刊，而Scopus 数据库收录的期刊更全面。
数据库不同，同一本期刊 IF 和 h 指数的结果会有差异。Gorraiz J 等人研究表明，，Scopus 数据库中大部分药理学和药剂学期刊的 IF 高于 JCR 中的 IF。分析原因，Scopus 数据库收录期刊的覆盖面比 WoS 要广，更新要快。理论上分析，h 指数与 SJR也受数据库覆盖面的影响，数据库覆盖面越广，引文数量、类型增多，时间跨度扩大，且越可能被更多高声望的期刊引用，h 指数与 SJR 会相应偏高。但 ES 和 SNIP受数据库覆盖面的影响较小，两者在计算中通过不同的方法对数据进行了标准化处理，排除了数据库对不同主题领域或同一主题领域不同方向的期刊覆盖面不同而导致的评价上的不公平。
据以上计算原理介绍可知，IF、h 指数和 SNIP 计算中不排除自引。由于自引可以通过增加被引频次而相应提高评价结果，近些年，期刊为了提高 IF，研究者为了利于稿件接受，导致引证行为复杂化，不正当自引越来越多。针对这一现象，期刊评价机构主张评价期刊时排除自引。SJR 和 ES 则在自引处理上做了改进，但由于研究的连续性而导致的正当自引也被一概排除在外，评价时正当自引的期刊在指标计算中则会失分。因此，期刊评价指标需要更精细化，更综合化。

……

第三章指标的实证研究 ................... 20
3.1 数据来源 ..................... 20
3.2 方法 ........................... 21
3.3 结果 .................... 22
3.3.1 数据的分布特征对比 ............. 22
3.3.2 指标的相关性及分类 .............. 22
3.3.3 因子分析 ........................ 25
3.3.4 综合指标的建立 ........... 26
3.3.5 综合指标的验证 ................... 27
3.4 讨论 ............................. 33
第四章创新点和不足 .............. 34
4.1 创新点 .......................... 34
4.2 问题与不足 ................ 35

……

第四章创新点和不足

4.1 创新点
（1）研究指标具有代表性，比较全面。由于 IF 出现时间最长，计算方便，被广泛使用，有关 IF 的研究不胜枚举。h 指数原理简明，在国外被广泛应用，国内也逐渐接受这一指标在期刊评价中的作用，近十年对它的研究也逐渐热门起来。但 ES、SJR、SNIP出现得较晚，计算过程复杂，数据封闭，不易验证，对它们的研究还不是很多，尤其是有关 SNIP 的研究，寥寥无几。但这几个指标的出现的确给期刊引文评价带来了思想上的变革，可以称为是期刊引文评价的代表性的主流指标。以往也有不少将这其中几个指标放在一起对比的研究，但没有将这六个指标放在一起的系统研究。
（2）选择基于 WoS 和 Scopus 数据库的 1881 份医学类期刊作为样本进行实证研究的也是首次。WoS 和 Scopus 是公认得比较有权威的数据库，时间跨度广，更新速度快，使用这两个数据库的来源指标数据，可尽量避免语种偏倚、数据库覆盖面、数据可靠性等的影响，同时，医学类专业方向多(共 85 个专业)、期刊类型多(综合型、专业型、综述型、研究型等)，样本量大(1881 份期刊)，国际化程度高(共 48 个国家)，学科发展迅速，更新速度快，引用周期较短，引用行为复杂，使用医学类期刊的数据分析，能更客观地比较 IF、IF5、h 指数、SJR、ES 和 SNIP。而以往的研究大多基于图书情报类期刊，或基于医学某方向，如眼科、心脏与心血管系统、免疫等，偶见以教育学、海洋科学类期刊为样本，都存在样本量小、比较的指标类型少、国别语种单一、学科领域跨度小等缺点。

……

结论

随着科技的发展，学术期刊数量的增多，越来越激烈的竞争使得学术环境变得愈加复杂。面对复杂的出版及引用行为，如何做到准确、公正地评价科技期刊，是国内外文献信息学者们一直探索的问题。科技期刊评价理论经历了近一个世纪的漫长发展过程，其脉络大致为：发文量分析—引文数量分析—引文数量与质量结合分析—引文网络分析……至今，还有众多的文献计量学家们在不断地丰富和完善引文分析理论。
目前，引文分析法被广泛地应用于科技期刊评价中，并产生了大量的引文评价指标。传统指标中，IF 在国内外期刊评价中占据着重要的地位。其计算过程简单，但局限性也很明显：默认所有引文具有同样的权重，不排除自引，对于极端数值的变化敏感等等。IF5 将统计的引文区间延长至 5 年，对 IF 做了一定的改进，但不能更正以上局限，而且从本研究及其他研究结果看，IF 与 IF5 排名差异小，相关程度极强，所以 IF5 取代 IF 意义不大。其他传统指标总被引频次、引用半衰期、自引率、他引率等虽仍是各大数据库统计的必选指标，但由于其功能单一，在期刊评价中多扮演辅助或参考的角色。
国外的期刊评价理论发展较快，先后推出了 h 指数、SJR、ES 和 SNIP 这一系列引文评价新指标，但在实践应用中，各大数据库也存在“各自为政”的局面，各自的数据库使用自己开发的评价指标，除了 h 指数被广泛统计(由于数据库收录范围不同、h 指数设定灵活，常常不同的数据库公布的 h 指数值不同)外，JCR 统计公布 WoS数据库的 ES，Scopus 数据库则统计 SJR 和 SNIP，选择哪一些指标评价期刊，给科研机构带来多重选择的同时也带来困惑。中国的期刊定量评价研究既取得了一定的成就，也存在创新不足的问题。对于国外常用的指标 SJR 和 ES 的研究还仅仅停留在理论层面，对 SNIP 知之甚少，更不用说将其应用于国内科技期刊的引文评价的实践中了；另外，现用的整个评价体系缺少合理论证，存在指标重复使用和使用不当的问题。

参考文献（略）

本文编号：44351

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/wenshubaike/lwfw/44351.html

上一篇：基于节能减排的公路建设项目经济评价
下一篇：化工工程矩阵式项目团队的 HSE 体系建设

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|