💡 观点 / 杂谈

本周思考杂记：更多待解之谜、智力与权力的关系、科学验证难题及达尔文主义的平行发现What I've been thinking about this weekend - More open questions, intelligence vs power, the problem of verification in science, the parallel discovery of Darwinism

dwarkesh.com·2026-04-27

作者本周的思考涵盖多个开放性问题：包括智力本质与权力结构的关联、科学理论验证的根本困境、以及达尔文主义被多位学者独立发现的惊人历史巧合。这些议题涉及认知科学、科学哲学和历史研究，反映出作者对基础性问题持续关注的学术取向。文中虽未展开具体论证，但提出了值得深入探讨的思想线索。

阅读原文

Dwarkesh Patel

我发起了一个博客竞赛，试图回答关于人工智能的两个核心问题。其实我的真正目标是想招一名核心研究员。这类问题还有很多，但我在之前的文章里没列出来，因为它们不利于判断投稿质量。所以这次干脆直接发在这里：

五大超大规模云服务商占据了全球70%以上的人工智能算力，而其中大部分实际上是为OpenAI/Anthropic/Gemini这三家巨头预留的。我们是否应该担心，那些不追求达到奇点或机器人工厂的应用——也就是让普通人获得更多能力、更好地理解世界、获得娱乐等——在全球算力分配中并非最高投资回报率的活动？考虑到算力的巨大价值（其机会成本会随着其上运行的人工智能模型质量提升而增加），普通用户是否会因此基本被排除在AI带来的好处之外？如果确实需要担忧，那么某种形式的全民基本收入或算力再分配机制具体应该如何运作？如果不担心，那这个问题本身是不是遗漏了什么关键视角？

数据无疑是过去几年推动AI模型进步的最主要因素。但我仍然困惑于这些改进具体体现在哪些方面。让我提出一些更尖锐的问题：显然Anthropic（现在也包括OpenAI和Gemini）已经掌握了构建具备长期规划能力的编程代理的关键技术。究竟是什么？仅仅是通过堆叠越来越多的强化学习编程环境就能实现吗？还是背后有某种更本质的突破？模型是否在变得更高效地利用样本（即每条训练样本能学到更多信息），还是说我们只是改变了/扩展/优化了输入的数据？这个问题之所以重要，是因为它决定了深度学习在真正需要样本效率的领域（比如机器人）上的发展速度。模型在上下文中的表现非常高效，且上下文信息可以被灵活复用。但注意力机制的“快速”权重为了实现这种快速学习却消耗了大量内存。为什么会出现这种内存与样本效率之间的权衡？以Llama 3 70B为例，其KV缓存大小为320KB/token。若将存储Llama 3权重所需的比特数除以其预训练时的token数量，可得每token仅0.075比特的信息密度。这意味着每比特存储的信息量相差了约3500万倍。

让我们将前沿实验室的计算资源划分为三个类别：预训练、强化学习生成和推理。强化学习生成与推理的工作负载看起来非常相似，但关键区别在于：模型通过强化学习生成过程进行学习（至少目前如此），而在推理过程中则不会。与此同时，模型在推理时确实能完成有用的工作，但在强化学习生成阶段则不能。许多人指出，训练与推理之间存在这种区分显得很奇怪，因为在极限情况下，这种区分本不应存在。那么这两类工作负载在实践中如何融合？从宏观上看，可以设想雇佣一个 AI 实例进行为期一个月的“试用期”，在此期间让它为你完成真正有用的工作，然后向模型公司提交一份评估报告。事实上，也许几年后，AI 若要继续进步，唯一的方式就是通过这种在职学习——因为模型已经饱和了从人为设计的短期强化学习环境中能学到的所有内容。

当互联网上大多数 token（以及未来模型将要训练的数据）都由其他 AI 生成时，是否会出现类似 Y2Key 的现象？这是否意味着 2023 年之前互联网数据集的价值相对提升了？

我去年六月在一篇关于持续学习的博客文章中写过这段话。这个观点正确吗？为什么持续学习中不会出现“赢家通吃”的动态？即使没有纯软件层面的奇点（即模型不断构建更智能的继任系统），我们仍可能看到一种广泛部署的智能爆炸。AI 将通过经济体系被大规模部署，执行不同任务并在执行过程中学习，就像人类一样。但与人类不同的是，这些模型可以在所有副本之间共享所学知识。因此，一个 AI 实际上是在学习如何胜任世界上每一个岗位。具备在线学习能力的 AI 可能在没有进一步算法突破的情况下，迅速演变为超级智能。

许多关于 AGI 影响的经济学分析都聚焦于人类需求——是经济会因我们的需求被更廉价地满足而萎缩，还是会因 AI 创造新产品而扩张，抑或因关系型产业增长而上升？但这些分析都默认：唯一重要的需求来自人类。那么我们该如何建模“机器专属经济”——即需求源自 AI 自身？一旦我们将这一因素纳入对未来经济的分析，结论会发生什么变化？

我最近有过一次有趣的讨论。有人问我：什么是智能？我说：是在广泛领域中达成目标的能力。对方接着问：按这一定义，唐纳德·特朗普难道不是当今最聪明的人之一？紧接着是习近平和弗拉基米尔·普京？

需要澄清的是，这些人显然在某些方面极为能干。但当我们谈论 ASI（人工超级智能）时，想到的不是特朗普，而是……那个不断追问的人正确地指出，我对智能的定义本质上就是权力（毕竟，权力不就是达成目标的能力吗？）。如果这就是你对智能的定义，那么斯大林就是有史以来最聪明的人。

当然，你也可以把“智能”的定义改得更接近“理解并构建抽象概念”。但请注意，世界上最有权势的人并没有在这项能力上达到极致。他们在形状旋转测试中略高于平均水平，而极端权力与这种智能之间的相关性，甚至可能比身高与极端权力之间的相关性还要弱。物理学家并没有在统治世界。

我们常常将追求权力的AI与科学和技术意义上的超级智能AI混为一谈。我并不否认AI可以具有权力欲——唐纳德·特朗普所具备的各种技能和驱动力，完全可以在数字意识中体现出来。我只是指出，目前让AI系统变得更聪明的方式（比如训练它们成为出色的程序员、思想伙伴或通用协作者），与权力之间的关联性其实并不强。

我们通常以一种误解的方式来谈论权力。我们的直觉往往被《外交》或围棋这类游戏塑造，这些游戏刻意设计成奖励某种特定的战略推理能力。但在现实世界中，权力更多来自于拥有权威和信任，从而能调动大量人协作，而不是靠某种“宇宙级大脑”般的谋划能力。特朗普之所以有权势，并不是因为他的大脑单独来看是地球上最高效的优化引擎，而是因为数百万人认为合法的政府赋予了他巨大的权力。

这里引入群体与个体层面的分析很有帮助。正如加里特·琼斯多次论述的那样，个人智商与个人收入的相关性只是中等程度，但国家层面的智商与国家发展成果却高度相关。这是因为智力具有很强的溢出效应——更聪明的社会更能合作、储蓄，并能协调完成航天飞机、半导体等重大工程。理查德·特里维西克——高压蒸汽机的先驱——本人贫困潦倒，死后被草草埋葬于无标记的贫民墓穴。然而，18至19世纪的英国拥有无数像特里维西克这样的人，正是这一点使英国得以建立全球帝国，击败世界各地的众多君主和皇帝。乔治三世本人未必是天才——事实上他在位中期就精神失常了——但他所统治的国家依然击败了拿破仑，征服了印度，建立了当时世界上最强大的海军。同理，即便某些公司的AI只是极其顺从的超级智能程序员和科学家，他们也能帮助那些普通得不能再普通的人类智能（比如实验室负责人、总统，或某种更难想象的控制结构）获得巨大权力。在我看来，正确的思维模型应该是：更有效率的AI公司和国家会通过正常的资本主义竞争方式胜出，而不是某个AI独自碾压所有人。

接下来两节我会整理我在迈克尔·尼尔森访谈中探讨的一些思路。那期节目是我最喜欢的之一。

我在尼尔森访谈中的核心问题是：“我们如何识别科学进步？”这个问题对思考AI需要具备什么条件才能闭合强化学习验证循环以推动科学发现尤为重要。但当我们回顾人类科学史时，它又显得出人意料地神秘且难以捉摸。

有些人认为人工智能在推动科学突破方面将具有不成比例的优势。他们认为之所以如此，是因为：1. 科学是“可验证的”；2. AI 在具有紧密验证循环的领域（如编程、数学等）表现卓越，因为可以在这些循环中进行强化学习（RL）。

但人类科学史表明，理论的验证周期可能长达数十年甚至数百年，即便这样，实验也未必能彻底排除其他可能性：古希腊人曾否定阿里斯塔克斯（公元前2世纪）的日心说，理由是它意味着恒星视差的存在。直到1838年，弗里德里希·威廉·贝塞尔才首次成功测量到恒星视差。

今天我们称之为更优的理论，其预测能力往往反而更差：众所周知，哥白尼以太阳为中心的圆轨道模型比托勒密的地心模型准确性更低——后者经过千年积累修正本轮，反而更为精确。鲜为人知的是，哥白尼的理论其实并不更简单：托勒密的模型通过偏心点（equant）机制解释轨道椭圆本质，即行星并非真正匀速圆周运动，而是围绕一个偏离地心的点运动。哥白尼对此不满，因为这违背了他的柏拉图式美学原则——于是他摒弃了偏心点技巧，导致模型变得不够简洁，不得不额外添加更多本轮和次本轮来弥补误差。

那么，1543年时日心说为何被视为更好的理论？某种意义上，它并不是！我们无法事先预知，直到开普勒三定律（1619年）与日心说结合，才形成一套更清晰、更准确的体系，也无法预知日心轨道与地面重力之间竟存在如此优美的统一性（牛顿于1686年揭示）。

但在1543年，确实有一个事前理由支持选择哥白尼体系：他的理论自然导出火星逆行现象，而托勒密模型中这是人为加入的假设。更令人惊叹的是，哥白尼在1543年提出的理论竟能准确预言金星的相位变化——这一现象直到1610年才被伽利略观测证实。然而，布拉赫的模型也能推出这两点结论——该模型设定太阳绕地球运行，而所有行星又绕太阳运转。

若按朴素证伪主义框架，必须等到1838年观测到恒星视差后，才能判定布拉赫错误。但显然科学界的发展速度远快于此。科学进步过程中掺杂着判断与启发式方法，我们对这些机制的理解尚不足以清晰表述，更遑论将其编码进强化学习循环中了。

再来看1846年海王星的发现：天王星偏离了牛顿力学预测的轨道轨迹。勒维耶据此推测必有一未知扰动行星存在，并计算出其质量与轨道位置，结果海王星几乎完全精准地出现在预测点上。

但海王星的故事也对应着失败案例的反面：水星存在异常进动——其轨道椭圆每世纪比牛顿力学考虑其他行星影响后的预期多旋转43角秒。这促使天文学家猜测水星轨道内存在一颗未知行星“火神星”。然而，这一难题直至1915年由爱因斯坦广义相对论才得以解决。

一个真正的牛顿主义者仍会推进研究议程，但会做如下修改：首先预测某个未知行星。若无法观测到，便认为它太小，需要更大口径的望远镜，于是建造更大的望远镜。若依然找不到，则可能是一团宇宙尘埃遮挡了它；若仍未发现，则可能是卫星仪器受到某种未知磁场干扰，于是发射新卫星。每一步骤中，若能发现新行星、未知宇宙尘埃或新的磁场，对牛顿主义者而言都将是一场轰动性的胜利。

从先验角度看，这种做法并非不合理！只有经过数十年甚至数百年的修补之后，我们才能进行分析——我们是像托勒密那样不断添加本轮，还是这个理论框架具有进步性，能够做出此前无法预见的预测。

这些例子说明了什么？说明在事前几乎不可能判断哪些研究纲领是进步的（能预测并解释未曾预料的新现象），而哪些是退步的（需反复扭曲自身以应对看似否证的新现象）。

但验证周期往往极其漫长且充满敌意，即便如此，实验也未必能明确排除其他替代理论（参见尼尔森播客中对1880年代迈克尔逊-莫雷实验的讨论：当时物理学家认为该实验只是排除了以太的某一特定理论，唯有爱因斯坦才彻底抛弃以太概念）。

这意味着重大概念突破难以被轻易验证。它们通常要等到几十年甚至几个世纪后，当人们发现其成果远超当时可用的其他理论时，才被真正认可。这对AI在科学中的应用意味着：1. 很难为重大概念突破训练出有效的强化学习（RL）循环。

而且 2. AI科学家群体仍需具备独特偏见与启发式方法的个体实例，持续数十年不懈地推进研究——例如像爱因斯坦坚持不存在任意惯性参考系那样。应当有人专门致力于维持若干休眠的研究议程，以防它们在进一步探索中显现价值。要理解这种对假说近乎顽固的执着——即便面对否证证据仍坚持正确科学理念——可参考以下故事：1815年，普劳特提出所有纯化学元素的相对原子质量均为整数，因实验显示多数元素确实如此。但存在诸多异常——例如氯的原子量测得为35.5。于是普劳特派声称这些元素所在的化学物质可能不纯。然而似乎没有任何化学反应能去除这些杂质。后来他们又说，或许是原子量的分数形式——但随着测量精度提高，这些分数反而越来越不自然：氯从35.5变为35.46。直到近百年后，人们才意识到这些测量揭示的是同一元素的不同同位素，可通过物理方法分离，却无化学性质差异。

我想说的是，事前无法预知哪个研究项目会更富有成效。我们需要同时投资所有项目。但这种做法看起来就像是一群科学家固执己见、坚持支持自己偏好的研究方向，显得非常不合理。

《物种起源》出版于1859年，而《自然哲学的数学原理》则早在两个世纪前的1687年就问世了。从概念上看，自然选择似乎比引力理论简单得多。达尔文的同时代人托马斯·赫胥黎读过《物种起源》后感叹：“怎么会这么愚蠢，居然没想到这个！”但从来没有人对没能抢先发表牛顿的《原理》表示过同样的惋惜。我在想，之所以出现这种情况，可能是因为虽然达尔文的理论在概念上更简单，却无法被明确验证。证据是间接的、回顾性的，而且是累积性的。不像牛顿那样有人通过计算月球的轨道周期和半径来验证其方程是否成立。

你还需要“深时”这一概念。查尔斯·莱伊尔于1830年出版了《地质学原理》，为达尔文提供了自然选择所需的漫长时间尺度。达尔文和华莱士几乎在同一时期提出进化论（两人都承认莱伊尔的贡献），这表明这些被低估的思想基础确实至关重要（地质学、研究已灭绝古代物种的古生物学、显示中间形态的生物地理学——有些甚至介于猿与人之间，以及航海和殖民时代带来的生物地理分布，还有像鸽子育种这样更复杂的人工选择）。有趣的是，一个对牧人和父母来说几千年前就显而易见的思想，实际上却需要数千年的辅助性直觉启发才能完整阐述出来。

科学与技术中平行发现的规律非常有趣，似乎与某些创新本可以更早出现的观点相矛盾。

火星似乎在地球以更快的内轨道超越它时逐渐减速并反向移动

由于金星的轨道在地球内侧，当你看到它在地球和太阳之间时应是全暗的，到一半时呈新月形，当它位于另一侧（即最小时）则完全照亮

他们的论文作为联合报告于1858年在林奈学会宣读

暂无帖子

需要完整排版与评论请前往来源站点阅读。