🤖 AI / ML

RLVR在科学验证方面可能存在系统性缺陷RLVR might be disproportionately bad at science

dwarkesh.com·2026-05-16

Dwarkesh Patel 提出理论验证循环（RLVR）可能在科学推理中存在结构性弱点。他指出，即使经过数十年甚至数百年的检验，某些曾被认为是更优的理论实际上可能做出更差的预测。这种滞后性与偏差表明，依赖经验积累的传统科学验证机制在面对复杂系统时可能失效。作者警告，过度信任长期公认的‘真理’可能导致认知盲区，建议引入更多元化的验证范式。

阅读原文

Dwarkesh Patel

我正在整理与迈克尔·尼尔森（Michael Nielson）访谈中探讨的一些观点。那期节目是我最喜欢的之一。

我和迈克尔·尼尔森访谈的核心问题是：“我们如何识别科学进步？”这个问题在思考人工智能能否完成强化学习（RL）验证闭环以推动科学发现时尤为关键。然而，从人类科学史的角度来看，这又是一个令人惊讶地神秘且难以捉摸的问题。

有些人认为人工智能在实现科学突破方面将具有不成比例的优势。他们认为的原因有两个：第一，科学是‘可验证的’；第二，AI 在那些具有紧密验证循环的领域——如编程、数学等——表现出色，因为可以在这些循环中进行强化学习。

但人类科学的历史表明，理论的验证周期可能长达数十年甚至数百年，而且即使如此，实验也未必能彻底排除其他可能性：古希腊人（公元前2世纪）就因日心说暗示了恒星视差而否定了阿里斯塔克斯（Aristarchus）的观点。直到1838年，弗里德里希·威廉·贝塞尔（Friedrich Wilhelm Bessel）才首次成功测量到恒星视差。

今天我们认为是更优的理论，在当时往往反而做出了更差的预测：众所周知，哥白尼（Copernicus）关于行星绕太阳做圆周运动的模型，其精度不如托勒密（Ptolemy）的地心模型，后者通过积累数千年的本轮修正来提升准确性。鲜为人知的是，哥白尼的学说在简洁性上也不占优势——托勒密的模型用偏心匀速点（equant）解释轨道的真实椭圆性质，即其他行星并非严格围绕地球做匀速圆周运动，而是围绕一个偏离中心的点运动。哥白尼对此不满，因为这违背了他的柏拉图式启发法，所以他摒弃了偏心匀速点技巧，导致模型变得不够简约，为此他不得不添加更多本轮和次本轮来弥补。

那么，1543年时它为何被视为更好的理论呢？某种意义上，它并不是！你无法预知日心说结合开普勒三定律（1619年）会形成一个更加清晰准确的体系，也无法预知日心轨道与地面引力之间存在如此优美的统一性（牛顿于1686年提出）。

但在1543年，确实有一个先验理由支持选择哥白尼：他的理论自然推导出行星的逆行现象，而托勒密则需要将其作为特设性补充。更令人印象深刻的是，哥白尼在1543年提出的理论实际上预言了金星的相位变化，而这些相位直到1610年才被伽利略观测到。不过，这两个结论同样可以从第谷·布拉赫（Brahe）的模型中推导出来——该模型设定太阳绕地球运行，而所有行星又绕太阳运行。

按照朴素证伪主义框架，人们必须等到1838年观测到恒星视差后，才能确定第谷是错误的。但显然，科学界的发展速度远快于此。科学进步过程中存在着某种判断与启发式的混合机制，我们对它的理解尚不足以清晰表述，更不用说将其编码进强化学习循环中了。

再比如1846年海王星的发现：天王星偏离了其牛顿力学预测的轨道轨迹。勒维耶（Le Verrier）推算出必有一颗未知扰动行星存在，并计算出它的质量与轨道位置，结果海王星几乎精确地出现在预测的位置上。

但海王星的故事是对失败案例的对称。水星存在异常进动——根据牛顿力学计算其他行星的引力影响，其轨道椭圆应每世纪旋转43角秒，而实际观测值多出这一数值。这促使天文学家推测水星轨道内存在一颗未知行星“维纳斯”。然而，1915年爱因斯坦提出广义相对论后，问题得以解决。

一个真正的牛顿主义者仍会推进研究议程，但会做出如下调整：首先预测存在一颗未知行星；若无法找到，则声称它太小，需要更大望远镜，于是建造更大望远镜；若依然找不到，可能解释为存在遮挡它的宇宙尘埃云；若仍未发现，则怀疑卫星仪器受某种未知磁场干扰，于是发射新卫星。每一步骤中，若能发现新行星、未知尘埃或新磁场，都将是对牛顿主义的重大胜利。

从先验角度看，这种做法并非不合理！只有在经历数十年甚至数百年修补后，我们才能分析：这些修正只是增加本轮，还是该理论框架具有进步性——即能预测原本无法预见的现象。

这些例子说明了什么？从先验角度看，几乎不可能判断哪些研究纲领是进步的（能预测并解释意外的新现象），哪些是退步的（需反复扭曲自身以容纳看似否证的新现象）。

但验证周期往往极其漫长且充满敌意，即便如此，实验也未必能明确排除替代理论（参见尼尔森播客中关于1880年代迈克尔逊-莫雷实验的讨论：当时物理学家认为它仅排除了以太的特定理论，唯有爱因斯坦彻底抛弃以太概念才完成这一认知飞跃）。

这意味着重大概念突破难以被轻易验证。它们通常在数十年或数百年后才被承认——届时发现这些突破远比当时可用的替代方案更具生产力。这对AI在科学中的应用意味着：1. 很难为重大概念突破训练强化学习循环。

而2. AI科学家的社会仍需要具备独特偏见和启发式方法的个体AI实例，并应数十年如一日地不懈追求——例如像爱因斯坦坚持不存在任意惯性参考系那样。应当有专门人员维持若干休眠的研究议程，以防其在后续探索中显现出价值。要理解这种为保留正确科学理念所需的顽固执着（即便面对反证），可参考以下故事：1815年，普劳特提出所有纯化学元素的相对原子质量均为整数，因为实验显示大多数元素确实如此。但存在诸多异常——例如氯的原子量实测为35.5。于是普劳特学派推测这些元素可能存在于不纯的化学物质中。然而似乎找不到能去除杂质的化学反应。后来他们又提出可能是完整原子量的分数形式，但随着测量精度提高，这些分数反而显得愈发不自然——氯从35.5变为35.46。直到近一个世纪后人们才意识到，这些测量值揭示的是同一元素的不同同位素，它们可通过物理方法分离，却无化学性质上的区别。

我想表达的是，事前无法预知哪个研究项目更具成效。我们必须同时投资所有方向。但这种投入在表象上，就像是一群科学家固执地坚持各自偏好的研究议程，显得极其不合理且冥顽不灵。

《物种起源》出版于1859年，而《数学原理》则发表于1687年，两者相隔两个世纪。从概念上看，自然选择理论似乎比引力理论简单得多。达尔文的同时代人托马斯·赫胥黎阅读《物种起源》后感叹：“竟然没想到这一点，真是太蠢了！”但从未有人对没能先于牛顿发现《数学原理》发出过同样感慨。我怀疑之所以如此，是因为虽然达尔文理论在概念上更简单，却无法被决定性验证。证据是间接的、回顾性的、累积性的。没有类似牛顿通过计算月球轨道周期和半径来验证其方程式的案例。

此外还需要"深时"（deep time）这一概念。查尔斯·莱伊尔于1830年出版《地质学原理》，为达尔文提供了自然选择所需的时间尺度。达尔文和华莱士几乎同时提出进化论（两人都承认莱伊尔的贡献），这确实表明这些被低估的思想支点至关重要（地质学、古生物学中的灭绝物种化石显示过渡类型（部分介于猿与人之间）、生物地理学基于航海与殖民时代的地理分布、更精细的人工选择实践如鸽子育种等）。有趣的是，一个数千年来对牧民和父母而言显然易见的观念，竟需历经数千年辅助性直觉思维才能完整阐明。

科学与技术领域的并行发现模式非常有趣，似乎与某些创新本可以更早发生的观点相矛盾。

无帖子

需要完整排版与评论请前往来源站点阅读。