Nature专题:颠覆性的科学发现是否越来越难诞生?
发布时间:2025-05-28 10:08 浏览量:2
导语
Russell Funk 根本没有预料到自己的研究会引发如此强烈的反响。但随后,他收到了铺天盖地的新闻报道和数百位科学家的支持邮件,随之而来的还有批评的声音。Funk 与合作者们在23年的nature研究中提出,随着时间推移,科研论文和专利的“颠覆性”(disruptive)在不断下降,意思是新出现的研究成果越来越少能淘汰已有研究。他们发表的这篇论文一经问世,就引起了 250 多家新闻媒体的关注。今年,这一发现甚至被带到了美国国会的听证会上。
关键词:科学学,颠覆性,新颖性,科学创新
2023年Russell Funk等在Nature发表的论文,集智俱乐部对其进行过翻译: “颠覆性”科学比率下降——背后原因尚需进一步研究
Funk 说:“这一切都难以置信,而且直到现在,仍有不少人主动联系我”。他目前在明尼苏达大学明尼阿波利斯分校研究科学知识的演化。论文的另一位作者是亚利桑那大学图森分校的社会学家 Erin Leahey,第三位作者是法国枫丹白露 INSEAD 商学院的组织行为学者 Michael Park。
这一研究成果似乎恰好反映了人们对现代科学影响力的深层担忧。数十年来,科技政策专家就一直担心,重大突破越来越难以取得,而这又进而导致经济增长放缓。如今,这一议题正被全球一些最具影响力的科学官员频频提及。 “与二十世纪那些巨大的飞跃相比,我们今天的进展显得黯然失色 ,”美国白宫科技政策办公室 (OSTP) 主任 Michael Kratsios 在四月的一次演讲中说道。美国国立卫生研究院院长 Jay Bhattacharya 在三月的听证会上 承诺要进行更多“前沿研究”而非“渐进式进展” ,随后却经历了一系列针对研究经费的大规模削减。
不仅在美国,世界各地的政界人士也在谈论科研投资回报率下滑的问题。“科学和创新是推动进步与增长的动力,如果这方面出现问题,我们就该担心,”比利时鲁汶大学战略研究员 Sam Arts 表示。他和同事们已就如何帮助欧洲多国的研究体系产出更多颠覆性成果,与若干政府部门进行了对话。
然而,自 Funk 及其同事的论文发表以来,批评者便指出其“颠覆性”度量方法存在缺陷,也就是说, 目前学界尚未就如何衡量一篇论文的颠覆性或新颖性达成共识 。尽管如此,人们似乎普遍认同,突破性创新变得愈发难以实现——只是在为何难以实现这一点上,各种理论相互竞争。随着讨论的持续,研究人员已开始开展实验,旨在更好地量化颠覆性成果,并提出可能促进其产生的策略。
Funk、Leahey 和 Park 在 2023 年文章中指出,从 1945 年到 2010 年,每年发表的具有“颠覆性”的论文数量基本保持不变,但是同期学术论文总量在激增,所以平均颠覆性因此下降。如果这一结论成立,就意味着单纯投入更多经费和人力,并未带来相应比例的突破性研究成果。
他们的论文采用了一个由 Funk 和密歇根大学社会学家 Jason Owen-Smith 于 2016 年提出的度量指标[2],通过考察引文模式来衡量颠覆性。其基本思路是: 一篇真正具有颠覆性的文章会深刻改变其所在领域,以至于后续引用该文章的论文往往不再引用它的参考文献(因为这些文献已基本过时);而如果一篇文章只是对既有成果进行了整合,后续引用它的论文则通常依然会引用那些前置文献 。具体而言,当一篇文章在后续论文中被引用,却不引用它所依赖的参考文献时,这就表明它具有更高的 “整合–颠覆”(consolidation–disruption,CD)指数得分 ,该指数取值范围为 –1(完全整合型)到 +1(完全颠覆型)。
在 CD 指数出现之前,学界也曾用 “新颖性” 指标来评估论文的创新度[3],即论文引用的文献跨学科程度。宾夕法尼亚大学匹兹堡分校的信息科学家吴令飞指出,新颖性和颠覆性看似相近,但新颖性真正衡量的是作者受不同领域影响的广度,而颠覆性指数则侧重于衡量一篇论文对后续研究的实际引用影响。
然而,引用数本身并不总能可靠地反映学术影响力。一些研究者指出,超过半数的引用文章对论文本身并没有实质性帮助[4]。此外,引用模式在数十年间也发生了变化:当下的论文引用的研究数量普遍高于过去,而且更倾向于引用更早期的研究。相反,那些早期引用文章极少的论文反而可能因后续论文不太可能引用其少量前置文献,而被误判为高颠覆性,这并不反映它们的实际变革性。 Funk 的团队在研究中已对引文模式的改变进行了控制,结果仍显示平均颠覆性显著下降。 一些批评者曾认为,早期元数据错误导致大量文章被记录为“零引用”,而这些文章恰好集中在研究期初,从而人为抬高了它们的颠覆性得分。对此,Funk 及其合作者在 2025 年 2 月的一篇预印本中反驳称[5],批评者所用数据集中同样存在更多的零引用文章,说明这些文章并未扭曲他们的分析结论。
另一种可选的方法是追踪论文中的用词。Funk 的研究也尝试了这一思路,通过统计论文和专利标题中独特词汇及词组的比例;并且分析论文中是否使用了诸如“produce” (产生) 、“disrupt” (颠覆) 之类暗示创新或颠覆的词,或诸如“improve” (改进) 之类暗示整合的词。研究者结合这两种方法,得出颠覆性明显下降的结论。
但今年,Arts 及其团队得出了不同的结论。他们回溯至 1901 年,对论文标题和摘要中的新名词短语或词汇 (例如 “photon”) 首次出现的时间进行了梳理,并追踪这些词汇在后续文章中的使用情况 [6]。Arts 的分析发现, 各领域的创新爆发时期各不相同,并不存在普遍意义上的新颖度下降 。他说到人们对新颖性随着时间推移而下降的担忧时,说道:“我们应当为此担忧吗?这当然值得关注,但这并非首要任务”。Bornmann 表示,确实也有论文支持 Funk 关于颠覆性和新颖度下降的结论,但他仍对任何基于引用的度量能否真正反映科学家所理解的“颠覆性”抱持怀疑态度,仍然需要确凿的实证证据。
检验 CD 指数的一种方式是选择一个显而易见的现代突破案例:那就是 2021 年发表的 AlphaFold 论文[7],这款蛋白质结构预测工具的发明者获得了去年的诺贝尔化学奖。Funk 表示,该论文的 CD 指数得分较低,“但我认为这是合理的。它是一项深刻的科学进展,但并未在概念上颠覆原有的生物学知识或折叠原理。”他同时指出,随着时间推移,AlphaFold 的 CD 指数或许会变得更高,因为在该突破刚发布时,引用早期成果的论文大多已在投稿过程中,故它们更可能继续引用旧文献。
UCL 研究政策专家 James Wilsdon 认为,AlphaFold 得分偏低恰恰说明了 CD 指数未能完全捕捉“颠覆性”的本义。 他对现有的任何度量颠覆性或新颖性的指标都持保留态度:“它们都不过是我们真正想理解问题的粗糙替代品。 吴令飞也认为,目前学界尚未就应采用哪些指标达成共识,这一领域仍处于“早期阶段”,这就像二三十年代的量子物理,看得越多,越觉得扑朔迷离。
这些论点之所以重要,在于研究人员正在基于不同的新颖性或颠覆性指标来评估科研经费的投放效果。例如,上月发表的一项研究 [8] 指出,美国过去四十年中获得 NIH 续期资助的科学家,其产出的研究在新颖性方面,显著高于同一时期未获续期资助的研究者,这或许说明,稳定的资助环境能够带来长期收益。该研究通过考察论文中关键词和概念的独特性及流行程度来衡量新颖性。
为寻找更精准的颠覆性度量,多位科学家正计划开展实验。Bornmann 将邀请研究者列举他们认为真正改变了科学范式的论文,然后比对各种量化颠覆性指标,看哪一种最能预测这些主观判断。哥本哈根大学研究系统数据科学家 Roberta Sinatra 则希望在论文公开前, 先让科学家评估其潜在的颠覆性,再在发表后看它们是否真的成为被广泛引用的突破性成果 。“我们需要更多主动性的实验,而不仅仅是观察性的数据,”她说。Funk 则表示,他目前主要转向关注论文、专利和基金申请中语言变化的度量方法,而不再单纯依赖引用指标。
尽管围绕如何准确衡量“颠覆性”和“新颖性”的争论依旧存在,越来越多的共识表明,科学创新的门槛正在不断提高。其中一个主要论点是: 创新和新技术最终将反映在经济生产率上,但其增长率在富裕国家已经放缓了数十年 。比如,在其 2016 年出版的《美国增长的兴衰》 (The Rise and Fall of American Growth) 一书中[9],经济学家 Robert Gordon 认为,二十世纪凭借汽车、冲水马桶、电灯等一次性技术飞跃所带来的快速增长时代,已经一去不复返。研究政策专家 James Wilsdon也感叹道:“这二十年来一直是各式各样的哀叹” 。
研究者还追踪了多个领域内研发 (RD) 收益递减的趋势。例如,一篇 2020 年由经济学家团队发表的重要论文 [10] 指出,为了维持摩尔定律 (即微芯片上晶体管数量每两年翻一番) 当今需要的半导体研究人员数量,是上世纪七十年代的 18 倍。他们还在农业生产率、心脏病与癌症治疗等领域观察到了类似趋势。“无论在哪个领域,我们都发现,构思新点子——以及它们所暗示的指数式增长——愈发难以实现,”研究团队写道。
另一项研究发现 [11],自 1950 年以来,每投入十亿美元 (经通胀调整) 的研发资金所获新药批准数量,大约每九年就减半。Sinatra 指出,自二十世纪中期以来,科研经费激增:1956 年到 2020 年间,美国的研发支出 (以实际购买力计算) 增加了 11 倍,研究经费和从事研究的人数都在指数级增长。然而,在她看来,这些投入所带来的突破却并未出现等比例的提升。她指出:“我们并没有看到一个越来越长的诺贝尔奖级别的发现清单”。
Funk 已经收集了 40 多篇文章,均指向创新率下降的证据。美国非营利资助机构 Open Philanthropy 的经济学家 Matt Clancy 在 2022 年对相关证据进行了梳理,也认为发现数量未能跟上科学家数量和研究经费的增长步伐。他的结论是:“科学正变得越来越难。”
如果科研投资回报确实在缩水,背后可能存在多重原因。
最显而易见的一点,正如许多科学家在给 Funk 的邮件中所说,是如今科研人员要花大量时间写资助申请、处理行政事务和授课,留给“原创思考”的时间所剩无几。一项荷兰研究发现 [12],该国大学的终身教授平均每周用于科研的时间不到20%。与半个世纪前相比, 现今的科研人员因职业生涯路径和经费申请的高度制度化,研究自由度大幅降低,难以投身非主流或高风险的方向。 剑桥大学科学史学者 Patricia Fara 提到,詹姆斯·沃森和弗朗西斯·克里克在揭示 DNA 双螺旋结构期间,曾暂时放弃手头的博士研究,冒着极大风险投身该项目。如今若有人这样长期脱岗,恐怕很难逃过惩处。
另一个解释是, 在“发表至上”的压力下,研究者或倾向于“将成果切片” (salami slicing) ,把研究想法分散到更多论文里,降低了每篇文章的颠覆性或新颖性。加拿大蒙特利尔大学信息科学家 Vincent Larivière 分析发现,从1996年至2023年,全球范围内的人均论文产出约翻了一番;而一项去年发表的分析表明, 科学家发表论文的数量与其颠覆性得分呈明显负相关 [13]。Funk 补充道,这并非基层“平庸科研”泛滥所致:他发现,即便在诺贝尔奖论文中,或发表在 Nature、Science 和 PNAS 等顶级期刊的论文里,颠覆性得分也呈下降趋势。
另一个影响因素是费用高昂的实验设备。西北大学伊利诺伊州埃文斯顿分校的组织与管理研究者 王大顺 指出,十七世纪的自然哲学家罗伯特·波义耳曾在伦敦的自家宅邸里做实验, 如今则需要像日内瓦附近的大型强子对撞机那样的巨型基础设施才能推动科学前沿 ,“当今的科学范围如此广阔且复杂,”他感叹。
还有一个问题是,随着知识体量膨胀,科研人员要学到能够站在前沿的水平,所需时间也更长。王大顺 说:“我们确实是在‘站在巨人肩膀上’前行,但这些巨人本身,以指数速率在不断长高。”
Sinatra 提出,真正具有颠覆性的论文依然存在, 但科学共同体用于阅读、理解和引用新成果的时间和精力是有限的 ,这意味着每年只有一小部分论文能够获得“突破性”的评价。她指出——“从众效应”,在社交媒体和算法推荐的作用下可能愈发突出,有将科学家注意力聚焦到一小部分论文上的风险。要成为‘突破’,就需要集体的关注,这也暗示,可能有些突破我们只是错过了。一些论文在发表后可能沉寂多年,甚至几十年,直到被重新发现并获得广泛引用。
但与创新放缓最难以调和的观点在于:研究者已经摘尽了最容易获得的“低垂果实”,如今若要取得新发现就必须付出呈指数增长的努力。若真如此,那么早期成熟的研究领域理应比新兴领域放缓得更厉害,因为前者的“低垂果实”早已被采尽。然而,Funk 认为, 无论是老牌领域还是新兴领域,其颠覆性指标的下降速度都大致相同。 他的分析表明,不同技术成熟度的专利,比如化工与计算领域,其颠覆性得分几乎是同步下降的。此外,其他创意领域如艺术,也出现了新颖度下降的趋势。例如,有研究发现,过去半个世纪以来的歌曲歌词变得更为重复 [14]。
Funk 认为,科学与艺术共同面临的困境是:对各类“指标”的过度优化,无论是论文引用量、歌曲播放量,还是电影票房。“如今大家比几十年前更以各种指标为导向”,而这种对指标最大化的追求,可能正在扼杀原创性。
随着人们对科学创新难度日益加剧的担忧不断升温,各类倡议、资助项目和机构如雨后春笋般涌现,试图探索可行的解决方案。
一种通常的建议是通过设立技术里程碑奖励来激励科研进展。 例如,美国国防高级研究计划局 (DARPA) 在2004年发起的“沙漠无人驾驶挑战赛”,要求团队研制能够穿越沙漠地形的自动驾驶车辆,这一举措为后来的自动驾驶产业奠定了基础。 另一个方向是加快并灵活化资助机制。 在新冠疫情期间,一些私人资助方承诺在48小时内作出拨款决定,让科学家能立即将研究重心转向抗疫,而无需等待传统资助流程的漫长审批。美国科技政策办公室主任 Michael Kratsios 在四月的演讲中即提到了奖励机制和灵活拨款两种方式。
德国和英国已先后成立专门的创新机构,明确以资助突破性技术与理念——而非渐进式改进——为宗旨。德国大众基金会 (Volkswagen Foundation) 甚至开始向研究者提供“科幻”课题资助,鼓励他们探索那些因过于异想天开而被其他资助方视作高风险的想法。为了避免资助资源集中于少数“热门”领域 (如人工智能) ,Sinatra 建议采用更随机的拨款方式。一些国家 (如新西兰) 已尝试在项目达基本质量门槛后,通过抽签决定哪项研究获资助。
来自“元科学”领域的研究也为注入更多颠覆性成果提供了线索。依靠 CD 指数,吴令飞和王大顺 的工作表明,小团队比大团队更易产生颠覆性成果[15]。吴令飞认为,大团队在组织协调和风险管理上承担更大压力,往往难以集中精力进行高风险高回报的原创性探索;同时,大团队更常依赖时限型资助,必须快速产出成果,“你得发表论文,却很难承担风险”。
集智对该吴令飞等人工作[15]的解读: 集智科学家吴令飞Nature发文:大团队渐进发展,小团队颠覆式创新
西北大学的 Brian Uzzi 合著研究发现[16],相较于同质团队,性别多样化团队产出的论文具有更高的新颖性——在 “新颖度”指标中,通过引用来自不同行业期刊组合的文献来衡量。此外,另一项研究表明,面对面协作 (而非远程) 可显著提升论文的颠覆性得分[17]。各国和机构也纷纷加大对元科学的关注与投入。去年,英国国家研究资助机构成立了元科学组织,指出过去的研究资助“过于规避风险、存在偏见、不够公平且效率低下”。
即便科学家们正努力更好地理解研究中的颠覆性与新颖性,并思考改进之策,科研投资回报的问题也日益成为政治争论的焦点。北伊利诺伊大学研究政策专家 Brian Uzzi 认为,正是这种氛围才让 Funk 的研究结果令科研界大为震惊。“科学家们看到后都说,‘天哪,如果真是这样,大家就要把钱投到别的地方去了’,”他这样描述道。在最糟糕的情况下,对科学生产力下滑的担忧会被当作攻击整个科研体系的武器。Uzzi 警告说:“这种说法可以用来打压学术界——事实上,这种情况目前就在美国上演。”
曾任美国国务院研究政策官员、现任华盛顿美国科学家联合会 (Federation of American Scientists) 研究员的 Cole Donovan 则认为,疫苗和癌症治疗等领域的科技进步依然在稳步推进。然而,他也指出:“技术改进的感觉已不如二十世纪那种家用冰箱普及、商业航班广泛开通时那样具有革命性。”他认为,正是这种“重磅”技术愈发稀缺的感觉,使得政治层面更容易削减科研经费。
Funk 本人最近也遭遇了美国国家科学基金会 (NSF) 的一笔资助被取消——这笔经费用于研究如何改进信息技术行业对女性的招聘支持。该项目只是特朗普第二任期内被砍掉的数千项资助之一。“当前对科研经费的削减令我深感沮丧,”他如是说。但他同时警告,不应因害怕敌对的政治势力借题发挥,而回避对科研颠覆性衰退的讨论。 “在我看来,直面创新放缓的现实,并不是对科学的威胁——而是拯救科学的关键。”