双十一期间本文限时免费试读,活动结束后将恢复会员阅读。

美国经济研究局(NBER)近期发布的论文显示,从2000年到2016年,中国在物理科学、工程和数学等领域国际科学期刊的发表量方面从“少数派”一跃成为主要贡献者:

以Scopus文献计量数据库收录的分层地址来衡量,来自中国文章的占比从2000年的4%跃升至2016年的18.6%,已超过了美国的总数。但这并没有真正反映出中国对科学出版物的贡献规模,这一被广泛使用的地址衡量标准大大低估了中国的贡献,因为它没有考虑到中国研究人员在海外撰写的、和以非中文地址发表的论文。Scopus数据库还排除了在中文期刊上发表的大量论文,虽然没有在国际期刊上发表的论文那么有影响力,但仍贡献了新知识并使其在广大中国研究人员当中传播。考虑到这些贡献,我们将中文论文调整为“Scopus等效性”后发现,中国对2016年科学出版物的贡献达到36%,对2013年的贡献为37%——约是中国在世界人口或GDP中所占份额的两倍。

衡量中国对科学出版物的贡献

衡量一个国家对科学出版物贡献的标准是这样的:拥有单一国家地址的论文将获得一个完整记分,而对于跨国合作论文,则依据其中的国家地址占比给予相应记分。比如,若一篇跨国合作论文中,一半地址都来自一个国家,该国将获得1/2个记分;若三分之一地址来自一个国家,则该国获得1/3个记分,以此类推。国家间记分的分配与该国地址的数量成比例,但相比在一个地址上只有一个研究人员的国家,这可能低估了在一个地址上有多个研究人员的国家的贡献。为了解决这个问题,在一篇跨国合作论文中,我们将根据一个国家的作者数量占总作者数的比例给予该国记分。考虑到中国研究人员的庞大数量,这对中国贡献程度的估计略有提高。

然而,地址度量法的最大缺点并不是忽略了在特定国家地址上的作者数量,而是完全忽略了一个国家的研究人员在非该国地址上发表的研究成果。比如,它会把在美国工作的五名中文署名作者的论文算作一篇美国论文,就和五名美国署名作者的论文一样没有差别。我们估计,2016年所有非中国地址发表的论文中,至少17%的文章有一位中文署名作者

图1显示了我们基于作者的地址和姓名对Scopus学术期刊中中国论文的加权贡献的估计。2016年发表的论文中有23.3%要归功于中国,这比按标准的国家加权地址衡量的贡献率(18.0%)高出5.3个百分点。该图区分了三种类型的中文论文:只在中国发表的论文;中国与非中国地区的国际合作论文;以及中文署名作者在非中国地址发表的论文。最大的贡献来自只在中国发表的论文,它从2000年的4.04%上升到2016年的17.87%。国际合作论文的比例从2000年的0.38%上升到2016年的2.82%,而在非中国地址发表中文署名的论文比例从2000年的2.94%上升到2016年的5.28%。

图2从不同的角度展示了中国在科学文献中扮演着越来越重要的角色——即衡量任何与中国有关联论文的占比。如果一篇论文至少有一个中文地址或中文署名作者,则关联度为1,否则为0。根据下图,在2000年发表的论文中有12.4%与中国有关联,而2016年这一比例达到了34.5%

在某种程度上,图1和图2中的数字夸大了中国对科学的贡献。事实上,研究人员对带有中文地址或名字论文的关注程度低于其他论文,对一篇论文受关注程度的衡量标准是它被引用的次数

图3的上方面板显示了中国论文平均引用次数与全球平均引用次数的比率。2000年,仅中国地址的论文只获得了世界平均引用量的29%,这意味着这些论文对世界的研究影响甚微。相比之下,在海外工作或与海外研究人员合作的中国研究人员的论文被引用次数要高于世界平均水平。对各种情况加权平均的结果显示,2000年中国研究人员文章引用次数与全球平均持平。数据显示,2013年的情况有所不同。与全球平均水平相比,中国论文在国际合作论文中被引用的次数增加了70%,而中国研究人员在非中国地址的论文被引用次数则趋于全球平均水平。而由于仅中国地址论文数量的大幅增加,使得2013年中国论文的加权平均引用次数低于世界平均水平

图3的下方面板显示了中国在全球被引用的份额。中国在全球被引用的比例从2000年的7.4%上升到2013年的19.5%,这主要是由于仅中国地址论文被引用比例的上升所致,这标志着全球科学研究重心向中国转移。

最后,关于中国在国际科学文献中日益增长的地位,我们在《自然》和《科学》杂志上调查了中文姓名和中文地址的比例。从图4可以看出,2016年,这些期刊论文中约有20%的作者名字是中文的,而8%到9%的地址是中文的——远远高于2000年中文名字或地址的比例,而且地址的增长幅度更大

缺失的重要拼图:中文论文及其引用

历史上,英语作为科学语言在20世纪的传播减少了其他语言的期刊和文章数量。令人惊讶的是,中国的情况并非如此。根据中国知网(CNKI)的数据显示,2000-2016年期间,中文论文的数量不断增加。这意味着,通过Scopus来评估中国对全球科学贡献的水平和增长,存在巨大的遗漏。虽然Scopus可能收录了最杰出的中文期刊,但92%的中文期刊没有被收录,几乎可以肯定的是,这中间必然包含了一些有用和有趣的科学。

图5记录了CNKI收录的自1980年到2016年在科学、工程和数学期刊上发表的文章数量;除去和Scopus收录重叠部分的数量;以及Scopus收录的文章总数。在20世纪80年代,CNKI上文章的数量远不及Scopus。此时,中国对科学的贡献是有限的,因为它人均GDP很低,无法支持很多科学工作,而且1966-76年的十年浩劫摧毁了中国的大学体系并缩减了研究。上世纪90年代,中国迅速重建了高等教育体系,使CNKI上的文章数量与Scopus大致相当。此后,CNKI的文章数量先是以比Scopus更快的速度增长,随后又趋于平缓,最终在2016年,这两个数据库的收录量大致相同(160万篇)。

中国在Scopus和CNKI上发表论文数量一致增长的根本原因,似乎是由于中国在研发、大学教师和工业研究人员方面的大规模投资,使得寻求发表研究成果的人员数量大幅增加。从2000年到2016年,以购买力平价计算,中国的研发支出增加了10倍,超过了欧盟并接近美国的水平。与此同时,中国的教师人数也增加了一倍多,研究人员人数增加了两倍。

质量和影响

通常,CNKI的文章没有国际期刊文章那样的质量和影响力。而且读中文的科学家比读英文的科学家少。CNKI的论文大多比Scopus上的论文更短,引用也更少,因此可能会包含更少的知识。另一个值得注意的点是,中国要求博士生和硕士生发表部分论文以获得学位,这导致许多论文发表的范围很窄——发在大学图书馆刊物而非其他地方的科学期刊上。这体现出质量分化,2013年44.6%的CNKI论文没有收到任何引用,而Scopus则为29.0%。鉴于英语出版物的影响力和质量通常较高,中国大学为在这些国际期刊上发表论文,提供了相当大的金钱和晋升奖励,这促使许多研究人员将他们最好的作品送往海外发表

在影响力方面,从图6可以看出,中国贡献了36%的Scopus等效文章,获得了37%的Scopus等效引用,且45%的Scopus等效文章与中国有关联。由于我们的计算忽略了Scopus外非中文的科学文章,这高估了中国在“全球出版物”中的份额。但是,由于Scopus收录了许多非英文和非中文期刊(约占14%),并且由于没有一个国家在其科学规模上接近中国,这样的调整不会实质性地改变我们的发现,即中国在科学领域的扩张“比你想象的要大”

结论

中国作为世纪之交世界上收入最低的国家之一,在不到20年的时间里就成为了科学知识的超级大国,这在科学史上是一个显著的成就。中国利用其新开发的科研资源,将在可预见的未来帮助推动科学和技术的发展。此外,鉴于科学和工程知识在现代经济和社会中的作用,中国在发展全球知识经济方面发挥了巨大作用。套用Horace Greeley在美国向加州扩张时对美国人的忠告:“年轻人,向西走,与国家一起成长”。除非发生重大变化,否则科学将向东发展,与中国一起成长。

参考资料:

Qingnan Xie and Richard B. Freeman, "Bigger than you thought: China's contribution to scientific publication", National Bureau of economic research, July 2018