英语原文共 12 页,剩余内容已隐藏,支付完成后下载完整资料
多学科的综合期刊质量测量研究:从效率出发
Hakyeon Lee a,Juneseuk Shin b
a:国立首尔大学公共政策与信息技术研究所,172 孔陵2洞、芦原区、汉城139-746,韩国
b:成均馆大学系统管理工程部,300春春洞 长安区、京畿道440-746,韩国
摘要:期刊影响因子的缺陷之一是:它不能应用来比较来自不同领域的期刊或多学科期刊,因为影响因子在各个领域是明显不同的。这项研究提出了关于期刊质量的新的测量,那就是捕捉不同领域的引用特征。我们从期刊的引用生成过程效率的角度看期刊的质量。与传统的应用于计算影响因子的变量一样,文章的数量作为输入,总被引频次作为输出,我们额外的纳入了两个不同领域的的因素——引用密度和引用动力,作为一个输入。我们也分开的去获得外部引用和自引的贡献并且在测量期刊性能方面合并了他们的相对的重要性。为了适应复杂的未知的输入和输出的关系,这项研究应用了数据包络分析(DEA)——个没有任何假设的一个生产函数测算决策单元的相对效率的多要素生产率模型。所得到的效率值,称为dea-if,然后可以用于评价比较多学科期刊的质量。一个工业工程期刊的个案研究的例子被用来说明如何测量DEA-IF及其有用性。copy;2013 Elsevier公司保留所有权利
关键词:期刊质量 数据包络分析(DEA)影响因子 综合学科
1、介绍
衡量期刊的性能一直是科学政策制定者和学术界的各种利益相关者,如图书馆员,研究人员和编辑所关注问题。毫无疑问,最常用的测量期刊质量或性能的是期刊影响因子(IF),每年出版的期刊引证报告(JCR)汤姆森路透社公布的。影响因子作为期刊质量的体现的使用是在引用频率目前可以测量期刊重要性的前提下的(Saha, Saint, amp; Christakis, 2003)。由于其可理解性,稳健性,简单性,和可用性,影响因子已变得越来越受欢迎,广泛用于各种目的(Franceschet, 2010)。图书馆员在有限的资金下通过查阅期刊影响因子来完成订购;研究人员急于将他们的论文投稿与影响因子高的期刊;拥有较高影响因子的期刊的编校商和出版商也将其作为一个广告;大学也将影响因子作为学院成员任职和提拔的一个标准;并且政府资助机构也以影响因子为基础来评判科学家并进行分配。(Cameron, 2005; Dong, Loh, amp; Mondry, 2005; Sombatsompop, Markpin, amp; Premkamolnetr, 2004).
然而,影响因子的不足也在以往的研究中被广泛报道(Amin amp; Mabe, 2000; Archambault amp; Lariviegrave;re, 2009; Bordons, Fernaacute;ndez, amp; Gomez, 2002; Cameron, 2005; Dong et al., 2005; Glauml;nzel amp; Moed, 2002; Ha, Tan, amp; Soo, 2006; Seglen, 1997; van Leeuwen amp; Moed, 2002)影响因子的使用一直被批评的方面是:代表性、覆盖面、操作性定义,领域依赖性。首先,期刊的影响因子是不能完全代表期刊的,Seglen (1997) 发现大多数引用率为15%的文章占据引用的50%,另一半的文章占据了90%。由于影响因子仅仅测量文章的平均引用率,所以它不能被用来衡量单独的文章。二是用于计算影响因子的数据库只覆盖了狭窄的范围。汤森路透社提供的WEB目前只涵盖了12000种期刊,少于期刊总量的10%。(estimated as 126,000 in Seglen (1997))数据库也对英语语言美国期刊更感兴趣。在数据库中,书甚至都没有作为一种来源,尽管各种期刊的影响因子都都被发表在一本书上。第三,影响因素有一定的操作定义的技术问题。期刊影响因子被定义为由前两年的中的被给的一年中每篇论文的平均被引次数。(Garfield, 1955)其中一个问题是包括在分子和分母的文章类型不一致。只有被引用的项目如文章、笔记和评论计入分母,分子包含引用的所有类型的出版物包括社论、信件和会议摘要。文章类型的组成表也影响的影响因子,因为评论比原始的研究论文更容易被引用。在分子自引还夹杂有争议,这将进一步讨论。另一个重要的操作问题是两年的引用窗口。在这样短的时间框架下可能会出现一个很强的时间偏差,因为更快的出版物可能会导致更高的影响因子,一个领域的短出版物滞后享有较高的部分引用到最近的文章,从而导致更高的影响因子。短窗效应是引起影响因子领域变化的原因之一,影响因子的引用动态将会在之后讨论。
第四个问题是影响因子的领域依存性,这正是本研究旨在解决的问题。影响因子的水平在不同的研究领域和学科领域是明显的不同的。这种变化主要归因于不同的引用密度和引用动态。(Dong et al., 2005; Seglen, 1997)引文密度——平均每篇文章的参考文献的数量,变化于不同的领域。影响因子是一个函数的引用密度在一个研究领域是众所周知的,因此,具有较高的引用密度的领域有可能有更高的影响因子(加菲尔德,2006)。在快速增长的领域,如生物化学的文章往往引用了很多更持久的领域,如数学的最新的参考。这被称为引用动态,它有一个显着的影响因素,因为在计算的影响因子只有两年内的引用。引文的很大一部分都被影响因子在高度动态的领域所捕获,而持久的领域只有一小部分的短期引用,并且影响因子小 (Dong et al., 2005; Seglen, 1997; Sombatsompop et al., 2004).
因为这些原因,一般不建议使用影响因子比较来自不同领域的期刊。尽管如此,影响因子的评价研究和不同领域的研究机构的滥用已经越来越常见 (Pudovkin amp; Garfield, 2004)。为了使跨领域的比较成为可能,一些规范化的程序已经发展到适应影响因素的跨领域的变化(Marshakova-Shaikevich, 1996; Owlia, Vasei, Goliaei, amp; Nassiri, 2011; Pudovkin amp; Garfield, 2004; Ramiacute;rez, Garciacute;a, amp; Del Riacute;o, 2000; Sen, 1992)。这些标准化的程序,只专注于每一个学科的范畴内计算期刊的相对位置,而不是明确地考虑不同类别不同引文密度和引文动态(Dorta-Gonzaacute;lez amp; Dorta-Gonzaacute;lez, 2013)。因此,虽然在测量输出的多学科研究方面引文分析是最常用的技术,但这种规范化方法不能应用于多学科期刊的比较评价(Wagner et al., 2011)。许多多学科的期刊是隶属于多类,因此一个规范化的过程中会为一个单一的杂志产生不同的分数。更糟糕的是,有些种类的多学科本身就在JCR中。即使一些期刊被分类为同一类,其影响因子也是高度依赖于被连接的学科的引用特征之上的。因此,测量多学科性能的的必要条件是明确捕捉到不同的被引用的密度和引用动态的领域。
本文的宗旨是以效率为基础的措施在用于测量多学科期刊的性能方面,可以是一个很好的补救措施。基本上,影响因子是一个定义为产出(引用次数的比率)到输入(文章的数量)的一个比率。换句话说,影响因子可以被看作是一个多产期刊如何生成引用过程的指标。然而,杂志上发表的文章的数量不是期刊的科学传播过程的唯一输入。我们的观点是被引用的文献数量以及在出版以及随后的引用所产生的时间差仍然是产生引用的关键输入。由此,我们明确的认为两种影响影响因子的因素——任何一个领域中与期刊有关的引用密度和引用动态。为了容纳多个输入和一个未知的生产函数的测量效率,本研究采用数据包络分析(DEA),它是一种用于测量的相对效率的决策单位的多要素生产率模型(DMU),没有任何假设的一个生产函数的函数形式。通过将两个场依赖因素,引文密度和引文动态,以及文章的数量作为决策单元的输入(期刊)DEA生产效率得分,他们统称称为DEA影响因子,用此作为衡量期刊的性能。得到的数据包络分析影响因子可用于多学科期刊的性能对比评价,因为它反映了各个领域中的每个杂志不同引文相关特征。
计算影响因子中的另一个重要问题是:是否包含期刊自引用。关于是否包含期刊自引有过很长一段时间的辩论 (Archambault amp; Lariviegrave;re, 2009)。自引用大大影响期刊的引文总量和形成影响因子中起着重要的作用(Falagas amp; Alexiou, 2008),一些编辑禁不住开始操纵影响因子以鼓励作者引用发表在杂志上的文章(Agrawal, 2005; Smith, 1997)。尽管如此,有偿的期刊自引也是有价值的因为它指示的贡献是放置在其学科当中的 (Vanclay, 2013)。高容量的自引是不寻常的或莫须有的领先期刊由于其题材的独特性、新颖性以及论文的一贯的高质量McVeigh, 2002)。因此,JCR期刊在计算影响因子时还包括期刊自引,虽然它也提供了一个额外的指标。是否要包括或排除期刊自引或者期刊自引有多重要并没有一个统一的定论。为了解决这个问题,我们利用DEA方法中的权重约束技术。作为输出变量,总引文被分解为自我引用和外部引用。对这两类引用影响因子的贡献比例的限制将使评估灵活反映了他们自己的判断的相对重要性。
本文的其余部分组织如下:第2节回顾了科研评价的DEA的使用和研究中使用的DEA模型。第3部分解释测量DEA-IF的模型,第4部分举工程学期刊的例子,文章最后一部分讨论结论和未来的研究方向。
2、DEA测量性能研究
DEA是一种用来测量多因素决策单元的相对效率的非参数方法 (Cooper, Seiford, amp; Tone, 2007)。一个决策单元的相对效率是通过估算加权投入产出比来和它与其他单元比较的。近年来,测量研发绩效的DEA的大量使用是因为它具有以下吸引人的特性 (Lee, Park, amp; Choi, 2009; Wang amp; Huang, 2007)。 首先,DEA是能够处理多个输入和输出的效率评价。研发活动通常涉及多个输入和输出,在标准参数方法中,不是很容易处理。DEA使各种投入和研发活动的输出被认为绩效评价。第二,DEA可以利用的情况下投入和产出之间的关系是未知的。由于DEA不需要任何关于生产函数的函数形式的假设,它适合研发不能指定的活动的生产函数。第三,在DEA有用的情况下,它对喜好有关变量的先验信息不存在。这正是研发绩效评估的背景,在这一过程中,没有被普遍认同的研发投入和产出的重要性。DEA的自动导出代表每个DMU的相对值的权重体系解决了这个问题。
由于这些优点,它享有作为一个研发的各级绩效评价工具所拥有的各种应用,如国家(Lee amp; Park, 2005; Sharma amp; Thomas, 2008; Wang amp; Huang, 2007),研究机构 (Liu amp; Lu, 2010), programs(Leeetal.,2009), 项目(Eilat,Golany,amp;Shtub,2006;Hsuamp;Hsueh,2009)。在学术界研究业绩也经常与不同层次的决策单元进行了合作,如大学 (Cherchye amp; Abeele, 2005; Feng, Lu, amp;Bi, 2004),大学中的部门(Abramo, Drsquo;Angelo, amp; Pugini, 2008; Johnes amp; Johnes, 1993),不同大学的研究项目(Groot amp; Garcia-Valderrama, 2006),以及大学内的研究机构 (Korhonen, Tainio, amp; Wallenius, 2001)。这些研究旨在衡量研究效率方面的科学论文的生产过程,主要是根据发表的论文数量作为输出。在知识传播的引文生成过程中,没有对期刊的有效性进行研究。一个尝试来衡量期刊的效率通过Petridis,malesios、 Arabatzis和thanassoulis(2013)建立起来了。他们利用DEA基于投入林业期刊的效率分析(一年内的期刊的出版频率和文章,每年出版三种期刊)和性能指标作为输出(特征因子分值、h指数、5年影响因子)。然而,使用DEA研究的目的在于通过整合不同的现有措施期刊生产单一综合指标性能,而不是开发一种新的基于效率的衡量杂志表现为多学科期刊的比较。
对于性能测量研究有许多DEA模型可用。第一个DEA模型由Charnes,Cooper,Rhode提出(1978),称为CCR,它假定生产具有规模报酬不变。银行家,Charnes,Cooper(1984)将CCR模型扩展为允许可变规模BCC模型,既然没有证据表明期刊的引文的生成过程具有规模报酬不变,所以我们采用BCC模型研究。DEA模型也由他们的目标分为:最大限度地输出(输出型)或减少输入(输入型)。这是含蓄地假设引用生成过程的目的在于增加输出(引用),而不是减少输入(如文章发表)。因此,本研究采用面向输出的模型。产出导向的BCC模型的形式表示为:
Xij是DMU J i输入量,Yij是DMU J i输出量,Vj是被给的i输入量,Ur是被给的r输出量,并且K是被DMU所测量的。CCR模型和BCC模型之间的唯一区别是Z的存在,这是在包络形成的凸性条件相关联的对偶变量。
所有决策单元的求解线性规划模型分配一个权重最好的设置为每个DMU,其中“最好的”意味着所产生的效率是最大的给定的数据。然而,如果先验知识或观念存在,DEA中重量的灵活性将导致不切实际的效率值的生产 (Allen, Athanassopoulos, Dyson, amp; Thanassoulis,
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[29238],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。