当前位置:无忧公文网 >范文大全 > 征文 > 基于文献计量学的国际基础数学领域作者合作网络分析

基于文献计量学的国际基础数学领域作者合作网络分析

时间:2022-03-12 08:18:19 浏览次数:

作者简介:尹莉(1982-),女,馆员,理学博士,研究方向:科技情报分析、数学方法在科技信息分析中的应用、科学技术史等。·信息计量学研究与应用·

〔摘要〕系统地统计了基础数学领域10本国际顶级期刊在1981-2011年间发表的所有论文的作者情况,做出了作者合作网络图。并应用社会网络分析方法对最大连通子网络的属性进行了具体分析,对网路的小世界效应、无标度特点、集聚系数等分别进行了计算分析,得到了一些有意义的结论。

〔关键词〕基础数学;作者合作网络;社会网络分析;文献计量

DOI:10.3969/j.issn.1008-0821.2014.04.023

〔中图分类号〕G250252〔文献标识码〕A〔文章编号〕1008-0821(2014)04-0102-06

Analysis on Author Collaboration Network in National

Pure Mathematics Using Method of BibliometricsYin Li

(Library,Changan University,Xian 710064,China)

〔Abstract〕The paper systematically counted all authors who published papers on top 10 journals in national pure mathematics,drawing the graph of author collaboration network.Then using the method of social network to analyse the property of the largest connected subnet,compute and analysis the small-world effect,the scale-free characteristics,the cluster coefficient of the collaboration network.In the end,obtained some significant conclusions.

〔Keywords〕pure mathematics;author collaboration network;social network analysis;bibliometrics

合作网络是复杂网络分析中一个热点研究领域,属于社会网络分析中的一个研究方向。其中科研合作网络是较早进行研究的合作网络之一,它是研究科学家、科研机构之间的相互合作关系而构成的网络。在这个网络中,将科研工作者或者科研机构抽象成一个个的点,将它们之间有合作关系(比如共同发表过一篇论文、共同合作完成一个项目等)抽象为边,这样所构成的复杂网络就是科研合作网络。在科学技术全球化的发展趋势下,科学合作成为科学家进行科学研究的主流方式,国内外众多科研机构与组织都积极参与科学合作研究,合作关系已成为提高科研机构成果产出能力的一个重要因素。而科学家合作网络正是科学家之间相互影响关系的抽象描述,通过对合作网络演化过程的描述,分析科学家之间连接结构的关系,人们可以分析合作网络的演化机制、科学家之间相互的影响力、新知识新思想的传播模式;同时还可以对如何增强科学家在相关领域的影响力、提高产出能力、促进本领域科学发展提供新的模式建议。

数学是重要的基础学科,而且越来越多地渗透到其他研究领域中。对数学领域作者合作网络的研究已有研究人员分析过,如巴拉巴斯在《科学合作的社会网络的演化》[5]一文中对数学、神经科学领域的作者合作网络进行了分析。由于数学在20世纪以来分类更加细化,虽然其应用非常广泛,但是对基础的研究仍然是一个重点,所以本研究将细化于基础数学领域进行作者合作网络的分析,以便能够为相关科研评价部门提供参考。

1数据的收集与整理

11期刊选择

研究选取了国际公认的基础数学领域10本顶级期刊,按照中国科学院文献情报中心对期刊的分区,将这10本期刊分为两类:第一类是位于1区中的5本期刊,是该领域最顶级、最权威的期刊,这些期刊创刊时间早,历史悠久,在国际数学领域的影响力强大。第二类期刊也是近30年来发展迅速的5本期刊,影响力也是比较大的。对期刊的分类见表1。根据JCR对期刊的分类,在数学(mathematics)类目下共有289本期刊,统计发现,在这289本期刊的影响因子排名中,所选取的10本期刊在排名前40中。10本期刊不论从影响因子、特征因子、文章影响力评分来看,都在数学类期刊排名的前列,因此从客观上讲所选择的样本是具有一定影响力的,分析的可行性比较高。

表1选取的基础数学领域的10本期刊

序号期刊名称创刊时间影响因子(2011)第一类1Annals of Mathematics193329282Journal of the American Mathematical Society198838413Bulletin of the American Mathematical Society189123214Inventions Mathematicae196623395Acta math-Djursholm18823333第二类6Memoirs of the American Mathematical Society195022597Duke Mathematical Journal193515378Advances in Mathematics196111779American Journal of Mathematics1878105710Transactions of American Mathematical Society19001093

虽然并不是所有的数学家都选择在这10本期刊上发表论文,但是经过统计发现,几乎世界基础数学领域著名的数学家都在这10本期刊上发表过论文,而且其中不乏菲尔兹奖、沃尔夫奖等一些著名数学奖项的获奖者,所以相信对这个数据样本进行分析会得到一些有意义的结果。

12数据收集

研究的数据来自于ISI-SCIE(Science Citation Index Expanded)数据库,设定年限为1981-2011年,分别以10本期刊作为来源进行搜索。得到类型为Article的数据记录为21 738条,以txt格式保存。

13数据整理

利用Bibexcel分析软件将数据记录进行整理,再通过手动处理,整理出31年间10本期刊的作者合著情况:1981-2011年,10本期刊共有21 738篇论文,有61篇论文没有作者信息,去除这些匿名论文记录后,共有论文21 677篇,共有作者14 415人,有合作关系的作者为11 032人。10本期刊的合著情况见表2。表210本期刊31年间论文合著作者人数统计表

作者人数论文数比例(%)111 312520427 509345432 387109844412035720336120068400211100042基础数学领域作者合作网络构建

根据统计所得的结果,整理成合适的格式输入到Bibexcel软件中,借助其构建作者共现矩阵。统计出共有21 738篇论文,14 415名作者,根据所生成的共现矩阵所代表的作者之间的合作关系,构建一个基础数学领域作者的合作网络。网络中的每一个节点代表每一位作者(同一个姓名由于大小写不一致,经过核对手动处理后,视为一个节点),每一条边表示作者之间的合作关系,只要有合作,即公开发表共同署名的论文,就把他们之间的这种合作关系用一条边来连接起来,两名作者之间如果合作多次,则将合作的次数作为边的权重。本研究中不区分作者的署名顺序,同一篇论文中每个作者之间的合作关系用全连接的方式表达。

将生成的作者共现矩阵输入社会网络分析软件UCINET后,得到该合作网络的拓扑图如图1所示。

通过分析,该合作网络是一个非连通网络,整个网络由1 460个独立并且各自连通的子网络构成,包含3个及3个以上作者的子网络有600个,而50%以上的网络都只有两名作者。这1 460个子网络是由一个规模很大的子网络和1 459个小的子网络构成的。其中最大的子网络有6 724名作者,而最小的子网络只有2名作者。这种由一个非常大的子网络和许多小的子网络构成的网络特征与Lu H Y,Feng Y Q以及Newman等人研究的合著网络特征相似。子网络分布情况见表3。图11981-2011年10本期刊的作者合作网络拓扑图

表3子网络分布情况

作者人数子网络数作者人数子网络数6 7241103241914191814171721162634143568133410812233211132860

从表3可以看出,该网络以2人合作的子网络数目最多,并且有一个6 724名数学研究人员所构成的最大连通子网络,在该合作网络的团队中发表论文数量比较多,作者合作较为紧密。根据研究目的,故选择具有典型代表性的最大连通子网络作为分析对象,考察网络的基本性质。

3最大连通子网络的主要性质

该合作网络中的最大连通子图是一个拥有6 724名作者的合作子网络。其拓扑图可见图2所示。

图2最大连通子图

31网络节点的度分布

网络中节点的度是一个节点连接的边的数量,一个顶点的度越大,在网络中与它相连接的节点也就越多。节点的度分布通常用分布函数p(k)来表示,其含义为一个任意选择的节点恰好有k条边的概率,也等于网络中度数为k的节点的个数占网络节点总数的比值。

其最大连通子图的度分布如表4所示,曲线拟合图如图3所示。表4最大连通子图的中心度分布

节点的度节点数目节点的度节点数目节点的度节点数目83128513596612761268621264119056125110103521249915747123128199421221072754112116633839120954463521913466434418173945332172521 583315162611 54330315332961437

图3最大连通子图节点度分布的曲线拟合

从图3可以看出,曲线拟合效果较好,经过曲线拟合后得到的度分布函数近似为p(k)=12167925k-2317,幂律指数为τ=2317,符合幂律分布。常见的无标度网络中幂律指数τ∈[2,3],可见该最大连通子网络具有无标度特性。节点度数与度分布的关系的Log-log图如图4所示:

图4节点度分布与节点度数关系的Log-log图Log-log图中,lgk与lgp(k)所呈现出比较好的线性对应关系,拟合所得到的直线方程为:y=-2317x+4085,拟合情况良好,这是一个递减的一次函数,表明网络中节点拥有连线的数量是一种幂律衰减模式。

经计算,最大连通子网络的平均度为2525,这与生物医学领域181、天文物理领域151、计算机领域97个相比,是比较大的。这说明基础数学领域度分布两极分化比较明显,度数非常大的点只有少数,大量度数较小的点存在于网络中,这种网络的特点是具有研究意义的。

32网络的密度和聚类系数

最大连通子网络的密度仅为00339,这是一个比较低的值。说明虽然这个子网络中节点数目庞大,但是合作密度偏低,具有较大的合作潜力。

最大连通子网络的聚类系数为0757,这个值是比较大的。纽曼在2001年曾经发表的论文《科学合作网络1:网络的构建和基本结果》(Scientific collaboration networksINetwork construction and fundamental results)中得到的结论为:Los Alamose-Print Archive论文作者合作网络聚类系数为043,SPIRES论文作者合作网络的聚类系数为0726,NVSTRL论文作者合作网络的聚类系数为0496。本研究中这个最大连通子网络的聚类系数为0757,说明该合作网络的聚集效应较好。

33网络的直径与平均距离

网络中距离最远的两个节点为2 177~3 831,网络直径为28。

对合作网络矩阵进行对称化处理后,计算出距离矩阵,并对距离矩阵进行计算得到了网络凝聚程度的临界值C=16703(网络的平均距离)。表5最大连通子网络的距离分布情况

距离频次距离频次距离频次121 422115 935 0422118 792269 228124 238 280227 4343190 770132 676 952233 1924490 512141 554 056241 39051 140 48615866 8842557462 331 46416478 3542628874 116 78217270 6362713286 053 80018155 602282697 273 4721986 378107 180 7922042 712

通过计算,在距离基础上的网络凝聚程度才为0077,网络最小距离为1,最大距离为28。从上表数据可以看出,距离为8、9、10的频次较多。这说明该关联网络中两个人之间要通过多个中间人(平均16)才能建立起联系。而两个人直接有联系的(距离为1)边仅有21 422频次。

34中介中心度

中介中心度是刻画作者在多大程度上控制作者合作网络中的交流关系,在网络中,很多节点都处在其他两个节点之间的测地线上。中介中心度越高的作者,他们在交流合作中的桥梁作用就越明显,在学术活动中也就越活跃。表6列出了发文数、点度数、中介中心度前50名的作者。整个网络的中介中心势为1355%。

由表6可以看出,Kenig CE,Shelah S,Eisenbud D,Christ M,Simon B,Friedlander EM,Caffarelli LA,Schramm O,Yau ST,Tao T,Bourgain J,Stein EM这12名作者不论是发文数、点度数和中介中心度都在前10名中,因此他们为合作网络的Hub节点,是合作网络的学术领头人。其中,以色列数学家沙龙·舍拉(Saharon Shelah )主要研究模型理论、数理逻辑,特别是公理化集合论。获得了2001年的沃尔夫奖。比利时数学家让·布尔盖恩(Jean Bourgain),1994年因在无限维的偏微分方程方面所做的工作而获得菲尔兹奖,与陶哲轩一起被称为是分析领域的大师。他发表过约328篇论文,发表的基本都是很好的杂志,而且基本上都是第一作者身份,在本研究中的10本顶级期刊中统计发现他发表了36篇论文,是一个高产作者。澳籍华人数学家陶哲轩(Terence Chi-Shen Tao,Tao T)2006年被授予菲尔兹奖,成为继1982年首位华裔数学家丘成桐教授获菲尔茨奖后,获此殊荣的第二位华人。获奖时只有31岁,研究领域主要在调和分析、偏微分方程、组合数学、解析数论和表示论方面。华人数学家丘成桐(Shing-Tung Yau,Yau ST)1976年因对“卡拉比猜想”的证明,获得了1982年的菲尔兹数学奖,并且成为获得这一数学界诺贝尔奖的第一位华人数学家。因为他对数学领域的杰出贡献,还获得了数学界的终身成就奖——沃尔夫奖。表6发文数、点度数、中介中心度分别排前五十名的作者

排名发文数点度数中介中心度1Kenig CEKenig CEBourgain J2Shelah STao TSarnak P3Tao TWainger SKenig CE4Stein EMShelah STian G5Bourgain JStein EMTao T6Eisenbud DEisenbud DPandharipande R7Christ MBerndt BCStein EM8Simon BNagel AEskin A9Pollicott MBourgain JAndrews GE10Shimura GChrist MCaffarelli LA11Lusztig GAndrews GE Lubotzky A12Friedlander EMSimon BOkounkov A13Sogge CDBump DPeres Y14Andrews GESarnak PHarris J15Sarnak PRallis SSeeger A16Caffarelli LAPeres YJitomirskaya S17Harris JYau STZaharescu A18Tian GIwaniec HGuralnick RM19Huneke CSchramm OYau ST20Meeks WHVega LMazur B21Popa SCaffarelli LAEisenbud D22Wheeden RLReiten IHaagerup U23Wainger SHoffstein JFarb B24Kashiwara MGesztesy FPreiss D25Yau SSTVance JMozes S26Haagerup UUhlmann GBuchweitz RO27Pandharipande RSeeger ANaor A28Lin HXSogge CDFriedlander EM29LI PMeeks WHCohen FR30Uhlmann GWheeden RLSiebert B31Rallis SHerzog JShelah S32Kollar JBaouendi MSGoldfeld D33Seeger ALubotzky AKnutson A34Mazur BDuke WLindenstrauss E35Schramm OFriedlander EMChrist M36Yau STLlibre JKollar J表6(续)

排名发文数点度数中介中心度37Lubotzky ACordoba ANi WM38Bump DRothschild LPRudnick Z39Metivier GYorke JALi JS40Aschbacher MKashiwara MKleiner B41Ono KFriedberg SMillson JJ42Dress AWMHofmann SSimon B43Iwaniec HHarris JKac VG44White BGinzburg DJerison D45Avramov LLKac VGAvila A46Nagel APonce GSturmfels B47Reiten INaor AMakarov N48Goldman WMCiliberto CSchramm O49Gross BHChoi YSRamakrishnan D50Schlag WDavis DMZieve ME

通过对国际基础数学领域10本顶级期刊1981-2011年作者合作群体的分析发现,历届菲尔兹奖获奖者大多数都在这些刊物上发表过论文,而且既是发文前50名的高产作者,同时也是合作网络中中心度排名和中介中心度排名前50的作者,他们中50%以上都是菲尔兹奖的获得者,而这个奖项是数学领域里最高的奖项。

4结果分析

(1)从合作模式来看,10本期刊的论文主要以2~3人为合作形式,所占比例约为4552%,4人以上(包括4人)合著所占比例约为244%。每篇论文篇均合作人数约为051人。而独立作者的论文数占到了52%,并且有研究者做过统计,生物医学领域篇均作者数为375人,天文物理领域为335人,计算机领域为253人,凝固物理领域平均266人。这些数据说明基础数学领域的合作规模并不是特别大,这与学科本身的特点是有一定的关系的,像计算机、生物等领域,一个研究项目通常需要众多的研究者参与其中共同完成,所以论文的合作作者通常有很多。而数学领域出现数目较多作者合作完成一篇论文的现象并不是很多,所以合作形式主要以2~3人合作方式为主。

(2)通过对该网络的节点度分布进行统计分析、曲线拟合得到度分布函数的幂率指数在[2,3]区间内,符合幂率分布特征。因此,该网络具有典型的无标度特性。

(3)网络的直径比较大,网络的平均距离约为16,即该网络中的数学研究人员之间需要通过约16人而建立起相互之间的联系,具有小世界效应。大部分研究人员之间需要约9个人建立起关系,说明基础数学领域的数学研究人员之间的间接合作比较常见。

(4)网络的集聚系数高,集聚效应好。而且网络中有个别度非常大的点,大部分的点中心度比较小,表明该网络中有个别极具影响力的人,成为合作群体中的核心人物。

(5)网络的合作密度偏低,表明数学领域的研究人员相互之间的合作并不是非常紧密,合作的潜力大。

(6)合作网络中大部分核心作者、高影响力人物都是菲尔兹奖的获奖者。而且他们的研究领域分布在代数、几何、分析这三大数学的基础研究领域,凸显了20世纪以来对基础研究的重视。

本文通过对基础数学领域的作者合作网络属性进行分析,得到了一些结论,希望能对科技评价部门的工作有借鉴意义。同时在进行分析过程中存在一些问题,如统计误差、作者群体选取不够全面等,有待在后续研究中进一步完善。

参考文献

[1]Newman M E J.Scientific collaboration networksINerwork construction and fundamental results[J].PhysRevE,2001,64:016131.

[2]Newman M E J.Scientific collaboration networksII4shortest paths,weighted networks[J].PhysRevE,2003,68:036122.

[3]Newman M E J.Coauthorship Networks and Patterns of Scientific Collaboration[J].PNAS,2004,101(1):5200-5205.

[4]MNewman,Who is the best connected scientist?A study of scientific coauthorshipnetworks[J].Physical Review,2001,64.

[5]Barabási,AL.,HJeong,et al..Evolution of the Social Network of Scientific Collaborations[J].Physica A,2002,311(3-4):590-614.

[6]王福生.情报学期刊科研论文与作者合作网络模型[J].情报学报,2008,(4):578-583.

[7]付允,等.科学学领域作者合作网络分布——以科研管理[J].科研管理,2009,(3):41-46.

[8]邱均平,李佳靓.基于社会网络分析的作者合作网络对比研究——以《情报学报》、《JASIST》和《光子学报》为例[J].情报杂志,2010,(11):1-5.

[9]李慧,丁德武,须文波.计算机科学领域作者合作网络及其分析[J].池州学院学报,2010,(6):11-14.

[10]张培培,何阅,周涛,等.一个描述合作网络顶点度分布的模型[J].物理学报,2006,(1):60-67.

(本文责任编辑:马卓)

推荐访问: 计量学 文献 领域 数学 合作