英语原文共 17 页,剩余内容已隐藏,支付完成后下载完整资料
测量研究系统的跨学科性:检测出版物类别和引用类别之间的区别
收到日期:2016年10月13日/在线发布日期:2017年3月14日
版权所有copy;Akadeacute;Miai Kiadoacute;,匈牙利布达佩斯,2017年
摘要 跨学科研究一直是学术界关注的焦点,从文献计量学的角度来理解跨学科研究的性质和结构是有益的。本文通过对出版物类别与引文类别之间的差异进行检测,来衡量单个出版物的跨学科性,然后以单个出版物的平均跨学科性作为研究体系的组成部分,来衡量一个研究体系的跨学科性。然后分别计算反映各研究体系要素跨学科、各出版物综合得分和扩散得分差异的平均差和标准差(标准差)。从三个科学类别(数学、应用、计算机科学、人工智能和运筹学、研究和管理科学)中选出60位最有成效的作者作为案例,以验证我们的方法。结果表明,测量个体元素的跨学科性,有效地减轻了某些具有不同引文类别的元素对研究体系跨学科性(特别是那些具有大标准差的研究体系)的影响。此外,当引用类别不出现在出版物本身的类别中,或者出版物只有一个引用类别时,衡量出版物类别和引用类别之间的区别对于个别出版物的跨学科是至关重要的。
关键词 跨学科bull;多样性bull;整合评分bull;扩散评分bull;科学范畴网
王雪峰
wxf5122@bit.edu.cn
1北京理工大学管理经济学院
2澳大利亚悉尼理工大学工程与信息技术学院
3北京理工大学图书馆
简介
由于科学和工程领域的紧迫问题需要单一领域之外的解决方案,知识生产呈现出学科融合的趋势。在过去的十年里,社会更加重视跨学科研究(IDR),因为它可以促进科学和技术创新。“整合”是跨学科与多学科和跨学科的独特特征(穆加布扎卡等人2016)。跨学科测量可以揭示知识流动的特征。
使用引文分析的文献计量学技术通常用于衡量研究输出的跨学科性,因为引文数据可以向我们展示科学中的当前、过去和未来活动(加菲尔德等人1978)。整合可以看作是对过去科学活动的落后引用。同样,扩散可以看作是未来科学活动的前沿引证。在最早的时期,波特和丘宾(1985)使用了一个指标,即类别外的引文,来进行跨学科研究。斯特灵(1994)指出,多样性有三个基本特性:即多样性、平衡性和差异性。波特等人。(2007)提出,综合反映在被引用主题类别的多样性中,作为一个令人信服的IDR指标。此外,他们在附录中标记了一个名为Reach认证的附加度量,它度量引用的科学分类网(scs)和每个出版物的科学分类之间的区别程度。然而,他们并没有对这两种配方进行充分的比较,但得出的结论是,整合度和达成度之间的相关性很高。斯特林(2007)分析了多样性对科学技术的重要性。根据斯特林的启发式理论,波特和拉弗斯(2009)利用引用的学科数量(多样性)、学科间引用的分布(平衡),以及至关重要的是,这些类别有多相似或不同(差异)。卡乐和波特(2012)在综合得分的基础上引入了一个扩散得分作为正向多样性指数。
上述综合和扩散指标通常被用来衡量多套出版物的跨学科性。波特等人(2007)使用reach认证在每个出版物级别测量集成指标,但后来没有追求reach认证太多。以往大多数指标通常将论文聚合为一个单元,将一个研究系统中所有出版物的引用类别和引用类别作为一个单独的部分,然后根据引用类别的多样性计算综合得分,根据引用类别的多样性计算扩散得分。然而,这种方法可能会导致两个主要问题。一方面,这些指标可能将一种出版物的高度跨学科性指定给了其他出版物。如果只有一种出版物扩散到不同的类别,那么不同的类别将与其他实际扩散分数较低的出版物有关系。另一方面,以前的整合和扩散指标对衡量单个出版物有限制,因为它们忽略了出版物本身的主题类别,如果引用的出版物或引用的出版物只有一个类别,则导致出版物的多样性变为零。然而,他们的出版类别可能不同于他们的引文类别,这意味着他们有一个跨学科的程度。
为了解决这些问题,一方面,我们试图衡量单个出版物的跨学科性,而不是整个出版物数据集。这种方法理论上对所有出版物的跨学科进行分类,并帮助我们获得有关其跨学科的更详细信息,例如找到对其跨学科贡献最大的独特引文类别。另一方面,我们从公式中学习并测量了每一篇论文水平上的文章类别及其引用类别之间的区别。这种区别是对一种出版物与其引用出版物之间差异的真实反映,这种区别可以更有效地说明互密码的程度。
论文的组织结构如下。在“跨学科和相关测量方法”一节中,我们回顾了跨学科研究的发展和测量。在“研究体系的跨学科测量”一节中,我们提出了研究体系跨学科测量的框架。在“案例研究”部分中,我们将重点验证我们方法的效果。“结论”部分回顾了我们的研究,并寻求有希望的研究机会。
跨学科及相关测量方法
随着科学和工程研究超越了单一学科的界限,许多科学家已经意识到跨学科研究(IDR)的潜力。伍德沃思可能是第一个在公共场合使用“跨学科研究”一词的人(弗兰克1988)。第一次跨学科国际会议于1970年在尼斯大学举行。吉本斯等人(1994)创造了术语模式2,他认为知识生产是多学科交叉的1 。在二十一世纪初,促进跨学科研究的国家学术委员会审查了凯克基金会赞助下的跨学科研究的范围。NAKFI评估小组采用了促进跨学科研究的跨学科研究定义:
跨学科研究(IDR)是一种由团队或个人进行的研究模式,它整合了来自两个或多个学科或专业知识体系的信息、数据、技术、工具、观点、概念和/或理论,以促进有趣的理解或解决那些解决方案超出单个研究范围的问题。密码或研究实践领域。(国家学术委员会促进跨学科研究2005:188)。
1关于20世纪跨学科的更多回顾,克莱因(1990年)的著作。
此后,越来越多的研究者开始关注跨学科的测量。瓦格纳等人(2011)对跨学科定量测量方法进行了文献综述,指出文献计量学,如合著、共同发明人、合作、参考文献、引文和共同引文,用于测量跨学科。跨学科不仅可以用研究成果来衡量,而且可以用提案(如专题重点和协作)或项目(如团队合作安排和混合资金来源)来衡量。此外,评估可能侧重于其他跨学科专业方面:教学(如跨部门和联合教学)或附属机构(如多个部门的联合任命和参与有组织的研究系统)(波特等人2007)。多样性概念(斯特灵2007;哈尔伯特1971;齐特2005;马古兰2003;卢梭和范赫克 1999)和社会网络指标(劳德斯多夫2007;博伊克2004;拉福尔斯和迈耶2010)也用于衡量跨学科。
穆加布扎卡等人(2016)总结了跨学科的文献计量指标,作为生态学领域生物多样性研究指标的一个子集。他区分了三种“理想”类型的世代多样性,并认为最常用的饶斯特灵指数属于第二代。许多研究人员对饶斯特林多样性进行了研究。耶格罗斯-耶格罗斯等人(2015)将跨学科视为一维性质。他研究了多样性、平衡性和差异性对引文影响的不同影响。然而,一些作者,如劳德斯多夫和拉福尔斯(2011)和周等人。(2012)表明绕斯特灵多样性不能为他们的实证研究提供理想的结果。基于上述方法,不同的研究者试图测量不同研究实体的跨学科性。
一些文章使用个人作者作为数据(波特等人2008年;舒默2004年;萨亚马和赤石 2012年;高文洛克和加桑2013年)。一些人在期刊水平上测量了IDR(张等人2016;所罗门等人2016;莫里洛等人2003)。还有一些文章是在研究系统、大学部门或机构层面上测量的(拉福尔斯等人2012)。拉福尔斯使用文献计量指标比较创新研究系统和英国领先的商业管理学校(BMS)之间的跨学科。黄等人。(2016)使用“山型”指标衡量单个授权项目的跨学科性,取项目总数的平均值。桑德尔和乔治(2011)在机构层面上部署了新的指标来衡量与匈牙利研发组织相关的跨学科。杰森和卢托库卡亚(2014)使用六个指标分析了600个实验室的跨学科。卡西等人。(2014)定义了一个分析研究机构跨学科程度的框架。他认为多样性可以在文章内部和文章之间分解。
在我们的研究中,我们提出了一个衡量研究系统(如期刊、作者和/或机构)跨学科性的框架,结合了多样性概念和出版物类别和引用类别之间的区别。
测量研究系统的跨学科性
研究问题
本文着重讨论了在测量出版套数的互密性时应注意的两个问题:(1)在计算某一出版套数的跨学科性时,如何避免某些特殊类别引起的测量偏差将所有类别作为一个整体的方法可能会将一个出版物的高度跨学科性分配给其他出版物;(2)如何更好地考虑出版物类别与引用(引用)出版物之间的距离。以往大多数方法的公式都没有考虑出版物本身的主题类别,而是通过观察类别忽略了引用行为的差异。测量积分或扩散的公式如下(卡利和波特,2012年):
I=1-
式中,pi是与给定论文中的主题类别(SC) i相对应的引用或引用参考的比例。求和是在sc*sc矩阵的单元格上进行的。Si, j是SC i和j之间相似性的余弦度量(余弦度量可以理解为相关性的变化)2。
为了更好地描述我们的研究问题,给出了两个例子。我们假设一个作者在一个类别(C1)中有三个出版物;一个出版物有两个引用类别(C1、C2);二个出版物有两个引用类别(C1、C3);三个出版物有两个引用类别(C1、C4)。它们的频率和相似性如图1所示。C3与其他三类的相似性较低。利用前面的指标,我们首先将C1、C2、C3和C4作为本文的整体引文类别,因此我们需要了解C2和C3、C4和C3以及C2和C4之间的相似性。假设这三个值分别为0.1、0.1和0.8,我们可以得到扩散分数(0.335)。实际上,作者只有一个出版物具有较低相似性的引用类别,而这一类别的频率只是一个。C3尤其与C2和C4没有关系,因为它们没有出现在同一出版物中,所以我们可以认为,出版物2的跨学科性已被分配给其他出版物。考虑到扩散分数越高,对外部学科的渗透越大,我们认为作者的出版物的跨学科性与实际情况相比可能会有所扩大。
2在这里,这个矩阵Si, j是基于美国国家联合引用科学网30261篇文章的样本(波特和拉弗斯,2009年)。
此外,我们还考虑了两种具有1类(C1)的出版物:出版物1在参考文献中引用了C1类和C2类。它们的余弦相似性为0.6,频率为(5,5)。出版物2具有被引用的类别C3和被引用的类别C4。它们的频率和相似性与出版物1相同,结果如图2所示。使用上述指标时,两种出版物引用类别的多样性相同,即两种出版物的综合得分相同。但是,引用的C3和C4类与公开应用的C1类的相似性较低,其余弦相似性分别为0.1和0.2,两种出版物的跨学科程度明显不同。
方法论
为了回答上述两个问题,本文在发表论文的基础上,提出了一个测量研究体系跨学科性的概念框架,如图3所示。研究系统可以是研究员、机构或研究主题/领
图1: 同一作者三种出版物的分类和引用类别
图2:两种出版物的类别和引用类别
图3;研究系统的概念框架
域。在每个元素(发布)中定义了三个数据集A、B和C。包含每个元素的工作操作系统类别。B包含所有引用出版物的类别。C包含所有引用出版物的类别。i1和i2表示数据集A中的类别。j1和j1代表数据集b中引用的类别。k1和k2代表数据集C中引用的类别。从B到A,我们将其视为集成过程,从A到C则视为扩散过程。
我们首先介绍了在每张纸上测量所有出版物的整合和扩散的方法。在此基础上,对研究体系的跨学科性进行了度量。图4显示了整个过程。
vantagepoint(www.thevantagepoint.com)是一个用于发现知识边缘的文本挖掘工具,它可以帮助我们构造两个相似矩阵。一个矩阵用于测量A和B之间的区别,另一个矩阵用于测量A和C之间的区别。这里我们给出两个矩阵的一个说明(见表1)。表中的第一列用于显示每个引文类别的频率。矩阵中的值是两个类别的余弦相似性。
每个元素的积分和扩散分数用公式(1)和(2)计算:
图4:测量研究系统跨学科的过程
表1出版物类别和引文类别的区别说明表
其中i表示元素本身的类别,j表示元素引用的类别。Si, j 是i类和j类之间相似性的余弦度量。数据集A中每个i类的比例表示为Pi.。Pj是数据集B中j类的比例,Pk是数据集C中k类的比例,积分和扩散分数在0到1之间,数值越大,说明文章的出版类别和引用类别之间的差别就越大。
构建了各研究系统的共现矩阵及其各元素的标识符。我们测量所有元素的积分和扩散的平均值。我们将研究系统的集
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[609524],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。