📝 其他

大卫·赖克：青铜时代为何是人类进化的关键转折点David Reich – Why the Bronze Age was an inflection point in human evolution

dwarkesh.com·2026-05-08

遗传学家大卫·赖克在访谈中指出，人类进化并非停滞，而是持续受到自然选择的强烈影响。他提出青铜时代的农业扩张、人口迁移和疾病传播加速了基因流动，成为进化史上的重要拐点。这一时期的基因变化揭示了环境压力如何重塑人类适应性。

阅读原文

Dwarkesh Patel

大卫·赖希回来了。

他和合作者阿里·阿赫巴里刚刚发表了一篇论文，推翻了关于人类进化长期以来的共识——即自农业革命以来，自然选择在人类物种中一直休眠。

通过扩大古代DNA测序的规模并开发一种新的统计方法，他们发现选择实际上加速了。

在青铜时代（大约3000年前），这种选择尤其剧烈。

正是在那时，从免疫功能到体脂再到智力的基因频率变化最为显著。

在过去1万年中，选择使认知表现的遗传预测值提升了约一个标准差——其中大部分发生在4000至2000年前之间。

录制结束后，大卫在白板上草拟了他关于尼安德特人真实身份的新异端模型。幸运的是，我拿出iPhone录下了整个过程。

他认为标准说法（即尼安德特人是我们与之略有杂交的某个古老谱系）与证据不符。相反，他提出尼安德特人本质上就是被大量现代人类基因淹没的群体。

大约在30万年前，高加索地区的一个小群体发明了中石器时代技术并向外扩张。进入欧洲的群体与当地古老人类杂交，被基因淹没后演变成了尼安德特人；而向非洲扩张的同源群体则遇到了更多样化的古老非洲人，他们的混合便形成了我们。

这意味着尼安德特人和现代人类拥有相同的文化祖先——唯一的区别在于之后与哪些古老人类发生了混合。

大卫是一位才华横溢且严谨的学者。再次向他学习真是一种享受。

在YouTube上观看；在Apple Podcasts或Spotify上收听。

Cursor在本期节目准备过程中非常有用。每当我有疑问时，就会让Cursor同时启动几个不同模型进行比较，结果发现这样比单独使用任何一个大型语言模型效果更好。如果你之前只用它来编程，不妨试试把它用于研究。访问 cursor.com/dwarkesh 了解更多。

Jane Street使用一种名为“hive bucks”的内部货币，通过实时拍卖分配计算资源——而且任何人都可以修改其他人的出价，甚至终止他们的工作！所有人都彼此信任，认为对方会为公司利益行事，这正是系统得以运行的基础。如果这种奇特且高信任度的文化符合你的口味，请查看 Jane Street 的招聘信息：janestreet.com/dwarkesh

Crusoe的ML基础设施团队开发了fastokens，这是一个开源分词器，在真实生产负载下，其速度比Hugging Face快约9倍，首次token生成时间最多可提速40%。Crusoe通过并行化处理以及巧妙的工程手段处理重复项而无需跨线程协调，从而实现了这些成果。了解更多请访问 crusoe.ai/dwarkesh

(00:00:00) – 古代DNA表明过去1万年存在强烈选择

(00:15:45) – 自然选择在青铜时代加剧

(00:35:02) – 为什么进化没有将智力最大化？

(00:57:21) – 进化受限于时间而非种群大小

(01:09:02) – 为什么冰河时代前没有出现农业？

(01:17:13) – 大卫无法停止思考的尼安德特人谜题

(01:54:10) – 这项突破背后的方法论

达瓦尔凯什·帕特尔

我再次邀请到了大卫·赖希，他是哈佛大学古代DNA教授。你如何描述你所研究的领域？

大卫·赖希

我是一名遗传学家，研究人类历史以及古代人群之间的关联，以及与当今人群的亲缘关系。

德瓦凯什·帕特尔

我们两年前做过一次访谈，结果成了我做过最受欢迎的一次之一。人们觉得特别有吸引力的是，借助你们实验室使用的技术手段，我们现在才刚刚开始了解人类历史上那么多未知的内容。

你最近有一篇新预印本论文，非常令人兴奋，我想和你聊聊它。能先给我介绍一下今天我们讨论的是什么吗？

大卫·赖克

这个古DNA领域开始的时候，也就是16、17年前，我们的梦想是通过从古代人类遗骸中提取DNA，追踪其随时间的变化，从而深入了解人类的生物学特征是如何演变的。但这个梦想从一开始就没有实现过。

不过，在揭示人类历史方面，这个领域取得了巨大成功。它带来了关于人类迁徙的惊人发现——比如，今天生活在这里的人并非源自数百、数千甚至数万年前就居住在此的人群；混合现象在人类历史上很普遍；性别偏向的过程也很常见。考古学的预期之外还有很多东西。从这个角度看，这个领域非常成功，但未能实现的目标是理解生物学和生物变化本身。

一个重要原因是样本量太小。单个人的DNA能提供大量关于历史的线索，因为当你观察一个人的DNA时，其实代表的是很多人：你的父母、祖父母、曾祖父母……回溯到几千、几万甚至几十万年前的祖先，都在今天每个人的基因组中留下了痕迹。

当你分析单个个体或尼安德特人的基因组时，实际上相当于拥有来自数万个祖先的信息。你可以非常精确地将这个人与其他有数据记录的人群进行比对。但如果你想知道某个特定基因变异（比如影响皮肤色素沉着、成年后能否消化牛奶，或者某种行为特征）如何随时间变化，单个人只能提供一个样本，最多两个——分别来自母亲和父亲。

要获得频率随时间变化的清晰图像，你需要非常大的样本量，真正海量的数据。直到最近几年我们才具备这样的条件。我们今天讨论的研究，以及未来几年希望多个团队能开展的工作，正是基于这样一个事实：现在我们终于拥有了足够的数据，可以通过数据分析来观察这些频率是如何随时间变化的。

德瓦凯什·帕特尔

我可以问个问题吗？接下来的几个小时里我会问很多外行的问题，但为什么频率变化特别有意思呢？

大卫·赖克

我们感兴趣的是利用过去数万年自然演化中发生的实验，来理解我们 DNA 中具有生物学意义的特征。如果一个群体经历了环境变化——例如，人们转向农业、开始与家畜近距离生活，或从寒冷地区迁移到温暖地区，或从低海拔地区迁往高海拔地区——那么这个群体就会面临适应这些新压力和新需求的压力。

检测这种变化的方法是观察某个遗传变异的频率是否系统地朝某个方向移动——例如，某个变异可能让你能在高海拔地区生存，或促使你形成一种在新环境中具有优势的行为模式——只要这种移动足够明显，就能被检测到。除非样本量非常大，否则很难检测到频率仅发生百分之几或百分之十的微小变化。我们要找的是那些因偶然因素无法解释的极端频率变化。这能告诉我们，人类经历的环境变化对生物体施加了选择压力。

Dwarkesh Patel

有意思。你们发现了什么？

David Reich

七年前，阿里·阿克巴里（Ali Akbari）当时是我实验室的博士后研究员，几年后成为正式科研人员，他开始利用我们生成的数据研究生物随时间的变化。我想他选择我们实验室而不是其他地方，是因为我们实验室一直致力于从古代人类身上生成大量真实可靠的数据。我们一直在努力将这一过程工业化，使其成本更低、质量更高，并为此生成大量具有优质数据样本。

我们已经生成了大量数据。这使得我们再次思考频率是否随时间发生了变化成为可能。在过去几十年的人类演化主流观点认为，自然选择在人类历史的最近几十万年中一直相对沉寂。

有若干证据支持这一观点。其中一条是：如果你比较来自不同大陆的多种人群，比如欧洲人和东亚人，并观察他们之间存在频率差异的突变——所有突变在频率上都会略有不同，有时差异很大——你可以问：“在欧洲人和东亚人之间，哪些突变的频率差异最大？”结果发现，几乎没有基因变化在欧洲人和东亚人之间的频率是完全不同的。

欧洲人和东亚人源自约4万至5万年前走出非洲和中东的共同祖先群体。该群体具有一定的基因频率，这些变异在随机漂变——即遗传漂变——的作用下上下波动，或可能在某一方向上受到选择作用的影响。从4万至5万年前到现在的时间跨度在进化尺度上并不长，因此这两个群体之间的平均遗传分化程度很低。

然而，如果存在自然选择，例如帮助某地人群更好地消化酒精或牛奶，你可能会预期会出现某种突变迅速达到极高频率。四万到五万年是很长的时间，大约相当于1500到2000代。这段时间足以让某个突变的频率发生100%的变化。但你所看到的变异频率并未超出随机预期的范围。

这些现象共同表明，自然选择可能一直处于静默状态。也许在几十万年前，原始人类种群已达到某种最优状态，此后在遗传上几乎没有发生变化。

虽然确实存在少量自然选择——比如清除不断涌入基因组的坏突变——但这不属于我们所说的“定向选择”。定向选择是指新出现的突变，或被系统性地推向某一方向的突变，从而帮助种群适应新的环境条件，达到更有利的适应状态。

我们能够区分：在我们观察到的约1000万个可变位点的频率变化中，有多少是由定向选择（即适应性进化）引起的，又有多少是由其他因素，尤其是遗传漂变造成的。结果显示，98%的变化来自其他因素，特别是遗传漂变。换句话说，绝大多数波动是由迁徙和人口结构变化驱动的。

因此，检测适应性自然选择的信号极其困难，因为它们只占总体频率变化的极小一部分。绝大多数变化源于人口混合和迁移。尽管如此，正如我们的研究所示，自然选择在整个基因组中其实一直非常活跃。

Dwarkesh Patel

我可以问一个澄清性问题吗？为什么我们要把种群混合或替代排除在选择之外？从群体层面来看，如果一个种群取代了另一个种群，这不就是选择的结果吗？

我记得上一期你提到，特定地区的人群发生了巨大变化——一个种群取代了前一个，接着又一个新种群又取代了它。只要遗传学因素解释了这种取代的原因，为什么它不应该被计入过去一万年中我们所理解的“选择”过程呢？

David Reich

当然可以算，也可能应该在某些方面算作选择。但也可能是这种种群更替由文化现象驱动——比如某个群体掌握而另一群体没有的技术。或许某些基因突变也参与其中。谁知道呢？这是可能的。

但你看到的是整个基因组的整体转变。而我们关注的是：是否存在某个特定DNA区域，其变化方式与其他区域不同，从而主导了这一改变。从统计角度看，在迁徙和人口混合时期，所有位点的频率都会出现剧烈波动。这些时期对检测自然选择极为不利。真正适合检测自然选择的时机，是当迁徙和混合事件停止后的几百年间。只有在这样的稳定时期，你才能观察到某个突变缓慢地向某一方向累积。

我们研究欧洲和中东历史的方法，是把它们看作时空中的一个个小群岛，每个区域的人口彼此之间相对孤立。比如英国的一个小群体可能孤立几百年，匈牙利的一个小群体也可能孤立几百年，期间经历了大规模迁徙和混合事件。在每个这样的自然实验中，我们可以问：某个突变频率是否略有上升？另一个突变频率是否也略有上升？如果所有箭头都指向同一方向，我们就赢了——这说明自然选择正在发生。

例如，4500年前在欧洲，几乎所有突变的频率都发生了巨大变化，但这并非自然选择所致，而是因为来自黑海和里海以北草原的移民潮。40%到80%的DNA来自雅姆纳亚人（Yamnaya），即草原牧民。他们携带的突变频率不同，不一定是因为自然选择，而是因为这些突变在数千甚至数万年里已在不同地区独立演化。当你观察后代群体时，会发现突变频率的巨大差异。关键在于判断：这些变化有多少是自然选择导致的，而非随机波动。

Dwarkesh Patel

所以你找到了这些似乎受到选择的位点。我还有一个澄清问题。你说你发现了3800个位点，你对其中50%在过去1万年中经历过自然选择有把握。

David Reich

实际上是有7200个位点，我们对其中50%的真实性有把握。也就是说，在DNA中有约7200个位置，我们以50%的置信度认为它们是真实的。但其中只有一半是真的——我们不知道具体哪些——所以真正有7200个真实位点。

Dwarkesh Patel

这是否也意味着，除了这7200个位点之外，你对基因组其他位置没有受到选择的信心？

David Reich

不是的。如果你将概率阈值设为25%，就会发现成千上万个位点，而且其中也有很多是真实的。事实上，我们进行的多种分析都表明，整个基因组都在经历自然选择的“振动”。

还有很多较弱的影响效应，会在比我们目前所做的研究规模更大的研究中显现出来。事实上，几乎每一个DNA位点都与另一个位点相关联，而那个位点正被自然选择以某种方式拖向某一方向。因此，自然选择并非沉寂，而是无处不在。尽管它只解释了2%的频率变化，但它却在每一个位点上施加着向左或向右的拉力。

于是我们分析了那些我们已经确认的位点——那些我们非常确信受到选择的数百个位点——看看它们在DNA中是随机分布，还是存在某种模式。我们还参考了大约100种性状，这些性状已有全基因组关联研究（GWAS）支持，涉及免疫、自身免疫、行为、代谢等多种特征。

对于这些性状，我们可以问：已知的全基因组关联研究（GWAS）中影响这些性状的基因变异是否具有异常的基因选择信号？我们发现的是，免疫性状存在显著的富集，大约高出四到五倍。在免疫性状中，选择的信号高度集中。我们还观察到代谢性状（如可能影响肥胖、脂肪特征或2型糖尿病的性状）也存在强烈富集，而对于行为或精神性状，我们几乎检测不到任何富集。

Dwarkesh Patel

只是为了确认我的理解。这并不意味着行为、精神或认知性状不受选择影响。只是说，控制这些性状的个体位点并不特别可能属于你识别出的处于选择之下的位置。

David Reich

完全正确。从分析结果来看，似乎免疫性状受到高度选择，而在过去1.8万年中，这个世界区域的行为性状没有受到选择。但这是一个错误的结论，我们有证据证明它是错误的。实际上，行为性状也受到选择的明显影响。

我们认为行为性状的信号较弱的原因是，根据医学研究，行为性状由大量基因共同决定，而免疫性状则由少数几个效应较强的基因决定。行为性状在遗传上是由大量效应较弱的基因塑造的，而我们缺乏足够的统计能力来检测这些非常微弱的信号。

当我们分析那些强烈的选择信号时，这一组非常强的结果有效地针对免疫性状进行查询，但对行为性状的查询效果较差。尽管免疫性状可能是被选择最多的类别，但这绝不意味着行为性状没有被选择——我们可以证明事实并非如此。

Dwarkesh Patel

有趣。

David Reich

我们已经能够证明，有两种方式可以将之前的观察结果与我们的新发现协调一致。请记住，之前的观察是，自然选择在几十万年或数万年的时间尺度上似乎是静止的。理由是，在欧洲人和东亚人之间没有看到100%的频率差异。

现在我们发现了数百个位点正以1%或更高的选择率迅速上升，在许多情况下都是如此。1%或更高的选择率意味着在数十代的时间内频率会迅速翻倍。在分离出欧洲人和东亚人的1500到2000代时间里，难道你不应该看到许多在群体间频率相差100%的基因变异吗？

我们能够证明，这种现象至少由两个因素解释。其一是，在这一地区——欧洲和中东——我们实际上正处于自然选择加速的时期。一种观察方式是研究我们正在观察到的富集模式，其中免疫特征与这些选择信号异常相关。我们可以将过去5000年（即青铜时代及以后）与之前的5000年进行比较。我们发现，围绕免疫特征的这种选择强度，以及同样围绕代谢特征的选择强度，在这段时间内有所增强。

自然选择并非在所有时间和地点都以相同速率进行。在我们分析的时间段内，它正在增强。可以合理推测，与之前相比，整个时间段的选择压力都在上升。我们正处在一个选择压力加剧的时期。这并非不合理，因为这是一个经历了生活方式和文化巨大冲击的人群。我们所分析的几乎所有人都是以某种方式从事农业或食物生产的农民。农业首次在世界任何地方出现是在中东，距今约11000至12000年前。发明农业的人们在距今8500年后迅速扩张进入欧洲，席卷整个大陆并快速传播开来。

在青铜时代，人们的生活方式变得更加密集，人口密度显著提高。人们越来越靠近牲畜生活，从动物和彼此身上感染疾病，并与之交换疾病。这是人类生活方式快速变化的时期，导致该人群产生了不同的生物学需求。在这些剧烈变化背景下，该人群的生物学特征未能理想适应，或许并不令人惊讶。

可能存在某些人所说的进化失配现象：将原本为狩猎采集者演化出的遗传变异引入农民或牧民群体后，其适应性并不完全匹配。你所看到的是，这个仅10000年前才从狩猎采集者分化出来的人群的DNA，正在对进入农业、青铜时代、高人口密度、城市化的环境这一冲击做出反应。一个假设是，我们所观察到的是由此产生的适应性变化。

Dwarkesh Patel

论文中你提到了许多关于青铜时代选择压力加剧的例子。或许可以逐一回顾其中一些。

David Reich

我们在这项工作中仔细研究了DNA中的许多位点。事实上，我们有一个名为AGES浏览器的互联网浏览器，它由Ali及其同事——也是论文的共同作者——开发。它允许你查询这1000万个位点中的每一个，查看每个位点的轨迹以及选择证据。

我们所看到的是，虽然大多数检测到的自然选择信号与时间上的恒定自然选择一致，但在少数情况下，我们能够观察到自然选择的逆转或根本性变化。这种情况往往发生在距今5000至2000年前的时期，即青铜时代和铁器时代，这是一个人口快速增长、多种技术被大规模使用的快速变革期。

一个例子是TYK2基因变异，它是严重结核病的主要风险因素，而结核病是目前世界上最重要的传染病杀手。如果你观察这个结核病的主要风险因素，这种变异在8000或6000年前频率急剧上升，到这个世界区域可能达到9%或10%。然后在过去3000年里又迅速下降。在这两种情况下，都有非常明确的自然选择证据——第一种情况是频率增加，第二种情况是频率减少。

一个可能的原因是结核病的传播。它可能在2000或3000年前就在人群中成为地方病。这与病原体序列数据和其他证据线可能是一致的。也许这种变异在那之前就保护了人体免受某种疾病的侵害，但之后结核病变得显著，并且由于它如此严重，导致选择方向相反。这纯属推测。

Dwarkesh Patel

它保护的可能是另一种疾病？

David Reich

也许是吧。

Dwarkesh Patel

从这篇论文中我得到的一个主要启示是：青铜时代发生了一些奇怪的事情。正如你所说，在各种性状上，选择压力都在青铜时代加剧。

这对某些事情是有道理的。例如，为什么我们会看到乳糖酶持续性的增强，即成年人能够消化牛奶，这在那个时期变得更加重要？正是在这一时期，我们开始使用牛不仅为了肉类，还为了牛奶、羊毛和其他副产品。因此，乳糖酶持续性的重要性增加是有道理的。

但还有一些其他的事情似乎自农业出现以来就应该很重要。我忘了那个等位基因的准确名称，但它是不是FADS1，它帮助将植物脂肪酸转化为身体所需的长链脂肪酸？当你从以狩猎采集为主的肉食饮食转变为谷物饮食时，这显然很重要。

这也是我认为你在5000到3000年前发现受到特别强烈选择的性状之一。那么到底发生了什么？为什么青铜时代在所有这些不同的性状上都如此特殊？

David Reich

所以这个FADS1/2变异是素食/肉食适应的结果。早在2015年Ian Mathieson与我合作的研究中，就已经识别出这是一个被强烈选择的变异。它实际上是古老的，甚至在古人类中也发现了它的拷贝。

我们论文的一个发现是关于ABO血型系统。你的血型被分为A、B和O型。B型变异的频率上升到10%，取代了A型，但之前的研究表明A和B型在人类与长臂猿及其他类人猿的共同祖先中就已经存在。这些突变在不同时期来回波动。

但我们讨论的是青铜时代的改变。TYK2变异（结核病风险和多发性硬化症风险）在青铜时代之前已经发生变化并增加频率，然后在2000或3000年前的那个时期又逆转了。在北欧地区这个过程非常强烈，既有极强的正向选择，也有极强的负向选择；而在南欧则只有轻微的变化，甚至负向选择也不明显。

对于血色病——这种在欧洲导致致病性铁积累的疾病——其影响也在这一时期有所逆转。在那些我们稍后可能会讨论的复杂性状中，自然选择的作用也出现了增强期。例如肤色变浅：在过去一万年里，欧洲人的皮肤变得更白了。这在我们的数据中可以看到。肤色变浅最剧烈的时期大约是在4000到2000年前，之后则显著减弱。

这似乎是一个极具影响力、充满变革的重要时期，许多我们现在观察到的过程都在这一时期变得极为强大。从第一性原理来看，这令人惊讶。你可能认为，在你接触这些遗传数据之前，最大的变化应该是开始种植植物和驯养动物。这一转变发生在距今1万至1.2万年前的农业革命时期，并在8500年前传入欧洲。但实际上，自然选择的强化发生在距今约5000年前，也就是4000年前。

这非常有趣。观察到这一点成为拐点，说明人类——至少在这个地区——的生活方式被彻底改变，与他们的狩猎采集祖先截然不同，以至于生物体必须进行强烈适应。也许进入青铜时代所带来的剧烈转变程度，甚至超过了从最初开始种植作物这一转变的程度。这令人惊讶，因为我们的直观印象是农业才是重大转折点。但生物学证据显示，基因组对距今5000年前后发生的事件反应要强烈得多。

Dwarkesh Patel

你在2014年与Bhatia及其他多位同事合作研究时，分析了今天2万至3万名非裔美国人的基因组。你提出：“看，他们有80%的西非DNA和20%的欧洲DNA。我们能否通过他们今天的基因组，发现等位基因频率与我们根据混合比例预期的结果有显著差异？”如果我理解有误，请纠正我，但你发现其实并没有差异。

也就是说，在经历了200至300年极其剧烈的环境变迁——从奴隶制到新环境的彻底转变——期间，并未观察到自然选择的作用。因此我们看到这样的案例：在某些时期我们看不到自然选择，但显然在青铜时代却产生了更强烈的效应，其环境变化的强度甚至超过非洲人迁移到新大陆并经历奴隶制度时的变化。

David Reich

确实可能是这样。也可能那个时期太短，难以观测到明显效果。在Bhatia等人那篇论文中，我们研究了约3万名非裔美国人，考察的是：除了平均约80%西非血统外，是否在某些DNA区域存在显著高于或低于80%的情况。如果出现这种情况，就表明可能存在针对某些欧洲人或非洲人遗传变异的自然选择。

我们在任何DNA区域都没有发现与随机预期有显著不同的结果。一种可能的解释是，自然选择发挥作用的时间仅有几代，比如五代左右。因此即使每代有2%的选择压力，累积效应也只有10%，时间上不足以检测到这种变化。

但青铜时代不是300年，而是3000年。这是复利的力量，你有足够的时间开始看到显著的效果。这确实、真的似乎是人类历史上极具影响力的时期，你可以在我们复杂的性状中看到这一点。例如看色素沉着，这是我们数据集中复杂性状选择最强的信号。你查看已知影响色素沉着的基因突变。它们在全部DNA中累积起来，有几十甚至上百个。当你观察自然选择最强的时候，时间点实际上是在2000到4000年前。

对于其他一些性状，你也看到选择最强的时期同样是2000到4000年前。例如，如果你查看影响认知能力指标（如今天白种英国人在智商测试中的表现）的基因变异。这在过去测量这种性状当然很奇怪，因为没有智商测试，也没有学校。但它如今是一个预测指标，你可以看看它在过去是如何变化的。

我们看到对这个能预测人们在智商测试中表现的基因变异的组合有非常强烈的自然选择，而且它与人们受教育年限或家庭财富的预测高度相关。这些在过去都是疯狂的性状，因为过去没有财富，也没有学校。但如果你看今天的预测指标，有一个强烈的系统性变化，大约是现代变异尺度上一个标准差的巨大效应。

我们可以做这个技巧，看看是否有某些时期自然选择发生得更强烈或不那么强烈。我们把一个2000年的窗口拖过我们的数据，重复整个分析，但不是在18000年上，而是在一个短的2000年窗口上。我们可以在每个这样的2000年窗口中衡量选择的强度。当你看智力时，你会发现它在青铜时代达到顶峰，在5000到2000年前之间。

在过去2000年里的影响几乎为零。完全没有自然选择的证据。你进入这个问题的偏见，我的偏见可能也是，如果这个性状有任何自然选择的信号，那它应该在过去2000年中异常强烈。也许这是一个工业化的时代。也许这是一个对这种特定性状需求更大的时代。但实际上，在过去2000年里完全没有自然选择的证据。在2000到4000年前之间有非常强的证据，而不是一个标准差的选择强度，平均来看是两倍标准差的选择强度。

Dwarkesh Patel

这里的标准差是指多基因评分本身移动了多少？

David Reich

在一个保持祖先不变的人群中，一个性状的多基因评分在1万年期间移动了多少。我们实际上是在我们的数据集中看一个异质的人群。有南欧人、北欧人、狩猎采集者和农民。在过去的不同时期，这些群体或多或少都有代表。

阿里·阿克巴里所发展的方法论的核心优势在于，它能够校正随时间推移而变化的祖先成分。实际上，这里要解决的问题是将整个数据集划分为分布在不同时空中的一个个小型人群“群岛”。我们关注的是每个时空节点上的一个小群体：比如4000至3500年前英国的一小群人、匈牙利的一小群人，以及2000至1500年前意大利的一小群人。在这些地区，若祖先成分在短期内相对稳定且未受大规模迁徙严重干扰，我们就观察遗传变异是否朝着同一方向发生演化。我们在校正了期间发生的重大人口变动后，测量每个时间点上的选择强度。

Dwarkesh Patel

这个效应非常显著。高于中位值一个标准差意味着处于第85百分位。你是在说，从一万年前到现在，由于自然选择的强烈作用，中位数已提升至第85百分位。这相当于在过去一万年里，对智力或预测家庭收入的能力等特质产生了巨大的影响。

尤其考虑到这只是等位基因频率变化总量的2%，其余98%来自迁徙……仅凭这一点就驱动了这类特质约一个标准差的变化，实在令人震惊——如果仅靠迁徙就能造成如此大的影响（至少在我们今天所能观察到的变异范围内），那么迁徙本身的影响究竟有多大？

David Reich

数据中一个明显的现象是：迁徙的影响巨大。例如，如果你考察现代人（白人英国人）认知能力测试得分的趋势，并追溯其古代祖先的预测值，会发现欧洲狩猎采集者的估计值比现代平均水平低三个标准差。这之间的差异极为显著。

接着你会发现，从狩猎采集者到农民群体，数值出现巨大跃升——农民群体恰好处于平均水平（零）。这就是迁徙的作用。你所看到的是，这两个群体在这类特质上原本就具有不同的“设定值”；而草原牧民群体的设定值则更低。

你会观察到该特质预测值随时间剧烈波动。但这并不证明存在自然选择，仅仅是迁徙所致。而我们所做的检验告诉我们：除了这些由迁徙引起的波动之外，是否存在一种贯穿所有时空、使该特质持续向同一方向演化的自然选择效应？这正是我们正在检测的内容。

Dwarkesh Patel

有一种被称为“集体智能假说”的理论认为，智力的选择方向恰恰相反。随着社会发展，专业化程度提高，每个人只需理解越来越小的一部分世界即可。因此，古人实际上比我们更聪明，而人类智力反而随进化有所下降。

你的研究结果似乎指向了相反的方向。尽管在过去两千年里，随着社会日益复杂，并未观测到选择作用，但至少在社会刚形成时，对于今天能预测智力的那种能力的需求更为迫切。

令人惊讶的是，如果你读过同事约瑟夫·亨里希的书，思考一下狩猎采集者——他们需要掌握和评估的信息量，从食物处理到搭建庇护所、生火等等，相比之下，我只需要知道如何设置麦克风和提问……似乎祖先环境对智力的要求应该高得多。因此，文明的开端反而增加了对智力的选择，这非常令人意外。

戴维·赖克这是数据的力量。我想，如果在这项工作之前你问乔，狩猎采集者会有怎样的选择压力，以及这个特定性状的设定点会是什么……他可能不会做出一个强有力的预测，但可能会说：“也许你会预期这种性状的预测值较高，因为这些人的确需要做很多事，解决很多问题。也许一旦社会变得更复杂，就会出现集体大脑，也许会对这种性状产生负向选择。”事实上，在某些方面恰恰相反。

这是数据的力量。它并非你所预期的那样。真正有价值的是数据能帮助我们理解所有这些现象。这非常有趣。关于智力遗传预测的研究有很多令人困惑的地方，值得深入探讨。或者也可以看看与它高度相关、甚至测量更准确的“受教育年限”的遗传预测。

如果你研究“受教育年限”的遗传预测，2017年冰岛的一个团队做过一项惊人的研究：他们分析了过去一百年间冰岛人的这一指标。研究对象包括较年长者和较年轻的新生代。仅仅在一个世纪内，冰岛人智力遗传预测值就下降了约0.1个标准差。这是一个在短时间内极其巨大的效应。这是对“受教育年限”的负向选择。如果我说的是智力本身，那并不准确。实际上是对“受教育年限”遗传预测值的负向选择。

一种可能的解释（姑且这么粗略地说）是：这里测量的并不是对真实智力或受教育年限本身的正向选择，而是另一个与之相关的不同性状。例如，受教育年限的预测值与女性首次生育年龄高度相关。如果控制住这一点，受教育年限的所有信号都会消失。所以，或许我们测到的其实是女性关于何时生育的决定。

如果女性更早生育，她们接受的教育就少；如果更晚生育，则受教育更多。也许这反映的是一种延迟满足、推迟行动或规划未来的能力。同样，这一特质也与身体质量指数、肥胖程度和步行速度相关。那么，这真的是我们通常理解的智力吗？还是说，它在不同历史时期以不同的方式表现出来？

显然，在过去，“受教育年限”本身并不是一个有意义的性状。但驱动它的底层因素却经历了强烈的选择。基因组中预测“受教育年限”的部分似乎正受到强烈选择。我们应该如何看待这一点？究竟是什么在基因组中发生了实际变化？

达瓦尔凯什·帕特尔

戴维·赖克

David Reich

有两件事你需要考虑。从基因角度看，受教育年限与许多其他因素密切相关。如果你观察的是受教育年限的遗传预测指标——这一特质已在数百万人身上测量过——你会发现它与一些令人惊讶的事物存在关联。它与女性首次生育的年龄相关，与肥胖相关，与步行速度相关，与家庭财富相关，还与一系列看似迥异的多种特质相关。

如果你认为自己实际上测量的是智力的遗传预测，或是真正的勤奋程度，那你就错了，因为它与许多事物相关联。似乎存在某种普遍的特质，或许可以称之为执行功能或延迟满足的倾向——我在这里只是泛泛而谈——这种特质正在受到选择。它推动所有这些特质朝同一方向变化，而在过去的不同时期，这种变化可能是有利的，也可能是不利的。

当我们发现这种针对白种英国人群体中表现为更长时间接受教育的遗传倾向的信号时，我们感到难以置信。这怎么可能？也许这是个问题。因此我们进行了一些测试，试图弄清楚这是否真实。我们做的一项测试是寻找一项研究：该研究中受教育年限的测量并非在欧洲人中进行，而是在中国人群中进行。我们观察了许多变异对中国人受教育年限的影响大小，并检查这些变异在过去一万年中在欧洲人群中的轨迹是否与之相关。

这两个地区的人群基本上完全隔离。欧洲人群在过去一万年的轨迹不可能偶然与中国今天受教育年限的变化有任何关系。但事实上，两者之间存在巨大的统计相关性：中国人群中变异对受教育年限的影响大小与欧洲人群轨迹之间的相关性高达五到六个标准差。其强度甚至与欧洲人群中变异对受教育年限的影响大小与其自身轨迹之间的相关性相当。我们完全无法想象这种情况会偶然发生。一旦我们观察到这一点，就相当确信这是一个真实的信号，并且某种自然选择可能推动了那些在今天表现为预测更长受教育年限的遗传变化的增加。

Dwarkesh Patel

只是为了确认我的理解正确，你是在分析欧洲的古代DNA。你说它似乎能预测现代欧洲人的受教育年限，或者至少，对那段古代DNA的选择似乎能预测现代欧洲人更高的受教育年限。你还发现同样的变异能预测中国人在中国的受教育年限。所以这不仅仅是欧洲GWAS研究中某种奇怪的伪影。这些基因组部分似乎能稳健地预测导致更长受教育年限的事物，至少在当今的人群中是如此。

David Reich

正确。

Dwarkesh Patel

退一步说，我想了解过去18,000年里我们的环境究竟发生了什么变化。我们已经稍微讨论过青铜时代之后的情况。这部分内容其实是在集体智能那部分对话中提到的。让我感到惊讶的是，像智力这类看似非常有益的特质，或者缺乏精神分裂症等特征，竟然在青铜时代之前并没有达到顶峰。

不同人群之间的差异如此之大，以至于欧洲狩猎采集者如果存在智力测试的话，其预测得分会比平均水平低三个标准差。但他们确实存在于一个智力至关重要的现实世界中。

怎么会这样呢？你只要看看人体或任何动物，进化都强烈地作用于它们，使它们的功能适应所需的行为。而这个似乎特别重要的特质——尤其是对人类狩猎采集者而言——为什么在旧石器时代或中石器时代没有经历那么强烈的选择压力？

David Reich

我认为这是个很好的问题。正如我们之前谈到的，自然选择在塑造性状方面非常有效。如果某种性状在特定环境中具有适应性，它可以在几百年甚至几千年的时间里，将性状的均值朝一个方向移动。所以你会想，难道在所有时间和地点，智力不都是好的吗？有几种思考方式。

首先，我们要从一个高度重视这一特定特质的社会视角来看待问题——也就是在IQ测试或类似测试中表现良好，或者能够长期接受教育的能力。我认为，人类历史上从未有过像今天这样的时代。如果你看希伯来和基督教圣经，你会发现智力的价值基本为零。

Dwarkesh Patel

但正是在《圣经》成书时期，尤其是《旧约》，对智力的选择似乎达到了历史上的最高点。

David Reich

没错。但那时看重的是力量、勇气或宗教信仰。这些才是核心价值。如果你读荷马的作品或其他宗教文本，根本不会提到智力。而是强调美和其他品质。这种过度关注聪明的价值观，显然不是过去普遍存在的特质价值取向。你可能会认为某些社群更重视与学校教育年限相关的近端价值。但从整体来看，它在人群中并不被高度重视。

Dwarkesh Patel

当然，我们现在关心的不是过去直接进行的IQ测试表现。我更想了解的是广义上的智力。也许IQ测试所衡量的智力，与"面对新环境，想办法获取食物、建造住所并完成其他一切事务"的能力相关性并不高。

你的同事约瑟夫·亨里奇（Joseph Henrich）等人曾谈到，现代人低估了用一个小群体完成这类任务的难度。也许这不是IQ测试所衡量的智力，这就是为什么我们没有在这个特质上看到如此强烈的选择效应。但直觉上，无论价值体系如何，拥有这种特质达到最优水平似乎都非常有价值。

David Reich

我这么说有点投机取巧。让我举两个例子来说明我的思路，但我也不是这方面的权威专家。如前所述，这些看似迥异的特征之间高度相关——肥胖、受教育年限、步行速度、IQ测试表现、家庭财富等等，这些看似疯狂的特征在很大程度上都受到一组共享基因变异的影响。

那么这到底意味着什么？在过去一百年里，冰岛人一直在淘汰这组基因变异。一种可能的解释是：这本质上反映了两种养育子女的方式之间的选择——要么多生少养，要么少生多养。如果你选择推迟生育、积累更多财富和资源，并将更多资源投入到每个孩子身上，那么你的生育率就会降低，孩子数量也会减少。这样一来，虽然孩子数量变少了，但他们可能更有机会存活下来并在社会中取得成功。或者你也可以选择多生孩子，但对每个孩子的投入较少。在20世纪冰岛这样一个物资充裕的时代，这种做法或许也说得通——即使每个孩子个体的发展不如人意，但总体数量更多。

这就好比在“多生少养”和“少生多养”之间来回切换。你可以想象，在不同的时间和地点……生态学中也有类似的现象。哺乳动物通常会在一次怀孕中投入大量精力，产下少量后代；而鱼类则会一次性产下大量卵，大部分都会被吃掉。但在某些条件下，这种策略反而是有效的。因此，环境条件的变化会导致这种策略的切换——要么投资于大量后代但投入较少，要么投资于少量后代但投入较多。也许我们只是看到了这种策略在不同时间和地点上的来回切换。

同样地，对于精神分裂症和双相情感障碍，这些疾病怎么可能具有优势呢？也许我们看到的这些疾病，其实是某种特质谱系的表现，在某些情境下可能是有利的。比如，在萨满教或重视有 visions（幻象）或创造力的人的宗教传统中，焦虑、富有想象力或神经质的特质可能会有所帮助。也许这些疾病是精神分裂症或双相情感障碍的亚临床版本，在某些时代可能是有利的，而在其他时代则可能是有害的。你看到的可能只是对不同情境下有价值的创造型思维或其他思维方式的筛选。

我在这里有点含糊其辞，但我的感觉是：这些复杂性状并没有朝单一方向演化，因为谱系的两端都有优势，而且这些不同特质的影响是多维度的。

Dwarkesh Patel

朱利安·杰恩斯在《意识在双脑心智崩溃中的起源》一书中提出了著名的理论。我可能理解得不够准确，但基本意思是：在荷马时代之前，所有人实际上都是精神分裂的。人们真的认为神是真实存在并与之交流的人。他的观点是：古代文献似乎表明人们就是这样行事的。

David Reich

你被要求相信的是一些幻象。即使在今天，某些宗教团体中仍存在通过幻象与上帝沟通、获得超自然体验并进行价值评估的现象。所以我真的无法理解。

但我认为探讨为何某些特质并非总是有利这一点非常有趣。对于精神分裂症和双相情感障碍而言，从某种意义上说，大多数突变都是不利的。我们从变异模式中可以观察到这一点——风险因素相关的变异往往频率较低，且效应较小。

Dwarkesh Patel

那么农业革命以来，另一个受到选择压力影响的是体脂减少的趋势。为什么会这样？

David Reich

你所看到的是：导致肥胖、体重指数（BMI）升高的基因突变组合减少了。与此高度相关的高脂肪质量、高腰臀比以及更高的2型糖尿病风险也呈现下降趋势。在过去一万年里，在这一地区，这些性状经历了约一个标准差的明显自然选择。

那背后可能发生了什么？为什么在之前并没有针对这些性状组合的选择？长期以来有一个被称为“节俭基因假说”的观点。其核心思想是：当狩猎采集人群进入食物充足的农耕环境后，就不再像过去那样需要大量储存体脂以应对饥荒，因为此时食物供应更加稳定。

因此，一旦进入农业社会并经历食物丰裕时期，自然选择就会对体脂储存产生不利影响。或许你所观察到的现象是：在过去一万年中，欧洲和中东的人群进入了食物相对更稳定的阶段，储存脂肪的优势降低，因而针对这一组性状的选择得以发生。事实上，欧洲人在遗传上对2型糖尿病的抵抗力比其他一些人群更强，比如非裔美国人和美洲原住民，他们可能没有经历过同样长时间的农业适应过程。因此，你看到的可能是长期暴露于更稳定食物供给的结果。

Dwarkesh Patel

这也是一种与普遍说法相悖的数据体现。普遍说法认为，狩猎采集者的饮食其实更稳定，因为他们食物种类更多样，不依赖单一谷物或作物获取热量。如果某一种猎物消失，他们可以寻找其他替代资源；由于不固定居住，他们也能更容易地迁移以应对变化。因此他们的食物来源更稳定。但如果确实存在对体脂储存的选择压力，那就说明：尽管农业社会的饥荒可能频繁且剧烈，但其稳定性至少高于狩猎采集者所处的环境。

David Reich

这里存在一个时间尺度的问题。你说得完全正确。据我所知（我并非人类学家），在传统社会中，人们在打猎成功后往往会暴饮暴食，短时间内摄入大量高营养食物，积累临时性的脂肪储备，然后可能连续数天甚至更久无法获得肉类。这种营养获取方式呈现出明显的“爆发—匮乏”循环，而这种情况在农耕社区中并不常见。

另一方面，饥荒在农业社会中更为常见，但其发生的时间跨度和节奏与狩猎采集时代截然不同。可能每三年才遭遇一次饥荒。事实上，如果你研究某些农民群体的骨骼化石，会发现其中存在更多压力迹象，这可能是由于大约每三到五年就发生一次饥荒所致。但自然选择未必作用于这个三年周期。你最近一次狩猎积累的脂肪无法支撑到三年后饥荒来临。因此，饥荒中的生存能力不同于为两周后的需求而储存体脂的能力。

Dwarkesh Patel

我有个随机的问题。你提到，与祖先环境中对适应度影响更大的因素相比——尤其是免疫系统，特别是在青铜时代之后——这些其他因素（如智力）对适应度的影响其实更大。它们承受的选择压力远大于智力。

这让我不禁思考：智力的提升空间是否更大？如果人类在过去十万年中曾被特别地选择以增强智力，我们或许会聪明得多。这一点之所以重要，是因为我们现在正在构建 AI 系统，并努力将其变得尽可能智能。事实上，训练过程的唯一目标就是提升智能——我们不必同时担心让它们的免疫系统变强——

David Reich

我们有足够的资源可以投入其中。

Dwarkesh Patel

而且同时确保它们不会精神分裂。我想我们某种程度上确实会担心这个问题。但如果在过去一万、两万甚至十万年里，智力并非人类进化的主导选择性状，那是否意味着这个特质还有更大的提升空间？

David Reich

我认为这些特质中的任何一个都有很大的提升空间。比如身高，完全可以朝一个方向极端发展，远比今天更极端。所有这些性状都可以被推向更极端的方向。当然，这样做很可能带来强烈的负面后果，你可能是在牺牲其他方面，存在明显的权衡取舍。但几乎可以肯定的是，如果自然选择在这些性状上施加的压力比现在更强，那么平均值一定会发生变化。

Dwarkesh Patel

所以自“走出非洲”以来的人类进化，都是在最初那个约有一万人的基因池中已存在的等位基因基础上进行的。这个群体从非洲扩散开来，最终演化出今天的人类。那么，令人惊讶的是，在所有这些不同性状——从认知特征到抗病能力再到身高——都表现出显著差异的情况下，是否说明当初那一小群人的基因库中竟蕴藏着如此巨大的潜在变异，足以支撑如今我们所研究的各种复杂性状的多样性？

David Reich

这是个深刻的问题。我认为人类群体内部对于复杂性状确实蕴含着极其丰富的遗传变异。影响身高的变异数量巨大，影响体质指数（BMI）的也是如此。如果把所有导致高个子的突变都设定为显性，一个人可能会长得像摩天大楼一样高。当然，这种情况永远不会发生。

但如果把所有这些影响精神分裂症风险的变异都考虑进去，并让它们朝着同一个方向发挥作用，那么个体将面临极高的患病风险或极强的保护效应。对于由多种突变共同决定的复杂性状而言，其变异的总和已经足以推动整个种群向环境中更适应的新平衡点迁移。

若将种群置于全新的环境之中，在数百年至数千年的时间内，种群便能迅速调整至新的适应性平衡点。某些特殊性状——例如消化牛奶的能力或对镰状细胞贫血的抵抗力——往往只需要一个极其关键的单一突变即可实现，而这种突变在当前人群中可能尚不存在。此时必须等待该突变在部分个体中自然发生。当种群规模较小时（如仅有1万人），可能需要数十代甚至上百代才能等到这一突变的出现。然而一旦种群数量庞大，便不再受限于突变发生的频率。

所有可能发生的突变都会实际出现。全球人口已达80亿之众，每代大约产生30个新突变，即每代新增约2400亿个点突变。而人类基因组仅包含约30亿个DNA碱基对，这意味着每代中每个可能的突变平均会发生约100次。我们已不再受制于突变速率的限制，突变可以反复出现，也确实会反复出现。但在仅有1万人的小群体中，有时仍需等待数十代乃至上百代，才能让新的有益突变得以显现。

Dwarkesh Patel

青铜时代所发生的变化，是否仅仅是因为当时人类种群规模已足够庞大？到公元前3000年左右，全球人口已达约5000万。此时种群规模足够大，不同地区间的基因流动也足够频繁，以至于那些虽非极端有利、但也不至于被进化淘汰的微弱选择优势，终于能被自然选择所察觉并加以利用。

David Reich

我认为这种说法未必成立，但这确实是一个值得深入思考的问题。事实上，只要种群规模达到百万量级，几乎所有可能出现的突变都会在几代之内全部显现出来。这远早于青铜时代——即便以欧洲或其他地区的局部人口来看也是如此；或许更接近农业兴起之初，或青铜时代的黎明期。你所提出的问题是：在种群规模较小的情况下，自然选择是否真的无法有效运作？

人们常认为自然选择在小型种群中效果不佳，这一点确实没错。因为在小型种群中，突变频率会在每一代之间因遗传漂变而剧烈波动。例如，在一个仅有1000个个体的种群中，突变频率每代可能随机偏移千分之一。若选择系数低于此值，则会被随机波动所淹没。然而即便如此，这种情况也仅需种群规模达到1000即可发生。而0.1%的选择系数已属极弱，我们讨论的却是1%级别的强选择效应，这类效应即使在仅有1000或10000个体的种群中也依然能高效运作。

如果你说的是那种只会在大群体中出现、而小群体中不会出现的突变，那么这些突变的自然选择系数大约在万分之一到十万分之一之间。这意味着它们需要经过一万到十万个世代才能达到较高频率，也就是几十万甚至上百万年。在我们讨论的时间尺度内，这种情况根本不会发生。问题其实出在时间跨度上。我们研究的都是强选择系数，数值在半个百分点以上，无论在小群体还是大群体中都会起作用。群体规模并不会影响这个结果。

达瓦什·帕特尔

有趣。你的意思是说，一旦达到某个群体数量阈值，起主导作用的就不再是群体规模，而是时间跨度了。

大卫·赖克

没错。这很有意思，而且实际上并不为大众所熟知。

达瓦什·帕特尔

说到数据与假设相悖的情况，你之前发给我的论文之一——Mallick 2016年就发现，现代人与5万年前的古老人类之间没有固定的基因差异。我们知道这一时期被称为“认知革命”的时代，现代性开始显现，人们也开始创作艺术。这是否意味着，现代人类的出现并非源于某种生物学上的改变？真正发生变化的只是文化层面？我们该如何理解这些数据所传达的信息？

大卫·赖克

对。在距今10万到5万年前，文化的变化速度明显加快。我们看到了最早的具象艺术、珠串项链、岩壁绘画，以及工具类型创新的迅速增多。人们可能会认为，在这一时期应该发生过某种关键的基因突变，或者说一个重要的遗传变化，在人群中迅速扩散开来，使得所有人都具备了某种能力，比如复杂的表征语言。

我们在2016年与Swapan Mallick等人合作的那篇论文中做了件事：我们系统地分析了DNA，寻找那些可能符合上述特征的区域——即几乎所有现代人共享一个共同祖先，时间大约在10万到20万年前。我们进行了非常仔细的筛查，在整个可分析的基因组范围内都没有找到比四五十万年更晚的共同祖先信号。

这个结果令人震惊，因为它似乎表明，在这段关键时期并没有发生任何对全人类都产生广泛影响的正向选择事件。我们之前讨论过欧洲人与东亚人之间缺乏共同的选择性清除事件，但更惊人的是，就连所有人类共有的选择性清除事件，在这个物质文化证据大量涌现的重要时期也几乎不存在。也许这一阶段确实发生了生物适应性进化，但它是多基因的——许多突变朝着同一方向协同作用，使群体适应新的环境状态，但没有某个单一的生物学变化能在这一时期迅速扩散至高频。

达瓦什·帕特尔

那5万年前这个群体，是所有走出非洲人类的祖先吗？还是也包括部分非洲人？

大卫·赖克

这是指10万到5万年前这段时间。这个群体是所有西非人的祖先，绝大多数东非人的祖先，以及所有非非洲人的祖先。

非洲有几个群体拥有大量来自更古老祖先群体的遗传成分。例如，南部非洲的科伊桑人（Khoisan）或中非雨林狩猎采集者（Central African rainforest hunter-gatherers）都有相当一部分祖源来自约20万年前与其他谱系分化的群体。但如今所有这些群体都能上大学，也能做其他人能做的所有事情。没有证据表明某些群体缺少其他群体所不具备的关键突变。

Dwarkesh Patel

我们看到不同人群之间的差异——尤其是如果5万到10万年前的这个群体人口规模非常小……我记得上次我们讨论的是大约1万人左右。那么可以说，今天全世界人类的变异几乎都潜藏在这个小群体之中。

我理解你的观点：仅仅将基因组中不同的因素叠加起来，就可能产生巨大影响。但令人好奇的是，今天我们拥有如此多样的群体，而这所有多样性却源自一个极其微小的初始人口。

David Reich

人类遗传学领域的大多数人都认为，我们的种群内部已经包含了塑造几乎所有性状所需的“黏土”材料。这些性状的平均值会随着环境条件或选择压力的变化而向不同方向移动。关于不同人类群体在过去经历了多少选择，这是一个经验性问题。

我们参与的新研究表明，至少在最近1.8万年内，这个世界这一区域的重要性状确实发生了显著变化。我们研究了超过500种性状，其中约有100种复杂性状在这段时间内呈现出系统性、方向一致的演变趋势。这强烈表明，人类在此期间对环境做出了反应，而且这种响应可能比之前任何时期都要强烈。

Dwarkesh Patel

我们之前讨论过，3万年前的人类与今天的人类之间不存在固定的遗传差异。所以，如果说推动人类发展出更丰富的象征表达、农业等能力的关键因素有明确的遗传基础——我想上次我们也问过这个问题，尤其是在当前背景下——那为什么在冰期结束前没有出现农业？从基因角度看，我们已经具备了相应条件。

David Reich

这是个非常有趣的问题。从基因上看，我们确实已经具备了条件。5万年前的共同祖先种群已经拥有发展农业所需的所有要素。这些人分布在世界各地：美洲约1.5万年前，新几内亚约4万年前，东亚、欧洲、西非等地。但在距今1.1万至1.2万年之前，没有任何地方发展出农业。它只出现在最近1.2万年的全新世（Holocene），也就是冰期末尾时期。

如果你去请教气候学家和考古学家——每次遇到这方面的专家我都会问这个问题——怎么解释农业会在这么多地方同时出现？难道我们真的生活在一种异常特殊的时代吗？他们告诉我，确实如此。从两百万年的时间尺度来看，1.2万年前我们进入了一个不仅温暖，而且气候极其稳定的时期。

很难相信我们正生活在一个如此特殊的时代。但如果你观察池塘底部的数据，通过同位素标记可以测量温度波动，显然我们现在正处于一个年际、十年际甚至百年际温度变化显著减小的时期。我们奇迹般地生活在一个相对稳定的气候阶段。

当这种相对稳定期出现时，多个群体竟独立转向农业，尽管他们拥有相同的基因组成——这些基因早在5万、10万、20万甚至30万年前就已形成。这是一个令人震惊的发现，人们却普遍接受，简直难以置信。

Dwarkesh Patel

哦，你刚才把时间范围扩大了。你说的是10万、20万、30万年前。基于现代人与30万年前人类的遗传差异来看，你认为那时的他们算是“现代人”吗？

David Reich

我不知道。这正是我目前一直在思考的问题。大约30万至40万年前，人类文化发生了巨大转变：发明了勒瓦娄哇技术——一种能从石核中制作石器的新方法。

所谓“中石器时代革命”（或称欧亚大陆的中旧石器时代革命），是一种由尼安德特人和现代人类共同掌握，但在东亚和南亚地区并未出现的石器制造新方式。这是一次重大变革，很可能涉及认知能力的跃升才能掌握此类技术。

随后在约10万至5万年前的上旧石器时代/晚石器时代，又出现了一次工具制造的进一步演变，但这次变革不如前一次那样具有颠覆性。因此，认知飞跃具体发生在何时仍不明确。

导致当今不同人群（如科伊桑人、南部非洲雨林狩猎采集者）谱系分化的过程，其时间尺度大约在20万至30万年之间。所有这些人都具备接受高等教育和从事各种活动的能力。因此，很难说20万或30万年前的认知工具箱、行为模式以及遗传能力尚未完备，甚至连尼安德特人也缺乏这些能力。实际情况未必如此。

我只是无法确定。你将这些源自20万至30万年前那次大规模分化的后代分布到世界各地，而到了1.2万年前之后，农业却在不同地区相继出现。这是人类历史上最令人费解的谜题之一。尽管我的同事们都告诉我这是事实，但我仍觉得难以置信——我们竟生活在这样一个气候学上独一无二的时代，时间跨度达两百万年。

Dwarkesh Patel

考虑到农业在多种截然不同的环境中独立发展，气候因素显得尤为惊人。我理解不同环境下的变异性可能有所降低。如果农业只在一个地方一个时间点出现，我或许还能接受这种解释。但新大陆种植玉米，旧世界则发展出谷物体系，两者环境迥异，这就令人意外了。

David Reich

这确实非常、非常令人惊讶。虽然我们接受了这一现象，但大多数普通人并未意识到，这是一个多么反常的观测结果。

几乎所有人都认同的一点是，除了雨林狩猎采集者和科伊桑人之外，全世界大多数人的共同祖先群体大约可以追溯到7万年前。这些人都具备了农业革命和建立国家社会所必需的认知、行为及智力要素。当这些后代分布到西非、东非、美洲、欧洲、南亚、东亚、新几内亚等地之后，他们的后裔都在各自地区独立或半独立地实现了这一发展。

要做到这一点，认知资源必然早已具备，但这个过程却非常漫长——在共同祖先群体分化之后，这种“引信”在各地延迟了4万至6万年，直到那时才点燃农业及其他相关变革。

这听起来简直难以置信。你甚至可以说这个“引信”其实长达30万年，从尼安德特人与现代智人分离，再到不同现存人类谱系分道扬镳之时算起，这也说得通。我们被要求相信的是一整套令人震惊的事实。

Dwarkesh Patel

有没有可能农业已经存在，但在公元前5000年青铜时代开始人口爆发之前，人们并没有现代冶金技术？从公元前1万年到前5000年的新石器时代早期来看，似乎并没有太多人口上的显著变化。有没有可能他们已经有了农耕，却没有铜或锡——这两种金属需要从中东获取，才能大规模制造青铜器并发展出相应的文明，因此他们在历史记录中逐渐消失了？

David Reich

我认为我们会看到他们的考古证据。美洲出现了极其惊人的发展，完全是石器时代的技术水平。

Dwarkesh Patel

如果这些人完全消失，我们现在还能看到他们的遗迹吗？

David Reich

当然可以。我们应该去墨西哥的太阳金字塔（Teotihuacán）看看。那地方太震撼了。我20岁那年去过，感觉和古埃及一样壮观。规模巨大，而且完全没有使用金属。

Dwarkesh Patel

更令人惊叹的是，它不仅在技术上没有金属，连动物和轮子都没有使用——大理石就是靠人力搬运的，连轮子都没用。

David Reich

没错。带任何一个认为旧大陆优越的人去看看这些遗址，他立刻就会改变看法。这些地方的成就实在非同寻常。这些人群至少是在2万年前就从东亚人的祖先那里分离出来，4万年前则与西亚-欧洲人的祖先分道扬镳。

但从那时起，他们拥有相同的生物和文化工具箱，只是直到很久以后这些潜力才被真正释放出来。这真是件不可思议的事，但我们对此并不质疑。

Dwarkesh Patel

你现在正在研究或者想要研究的，除了这类关于人类历史的宏大问题，还有哪些其他重要课题？

David Reich

我很困惑。我不确定我们之前是否讨论过，但我至今仍对古代人类与现代人类之间的关系感到十分不解。

我们现在拥有来自欧洲、西欧亚和中亚的古代人类，以及尼安德特人的基因组序列。我们还有来自这些神秘的丹尼索瓦人的古代序列——上次谈话后，我们已经获得了他们的骨骼样本。现在还发现了一个被证实属于丹尼索瓦人的头骨。现代人类的数据非常丰富，而这些群体之间的关系却隐藏着许多重大谜团。

从基因上看，丹尼索瓦人和尼安德特人是姐妹群。它们源自约50万至60万年前的一个共同祖先种群。这个种群又是在70万至80万年前从现代人类的共同祖先演化而来。全基因组数据显示，尼安德特人和丹尼索瓦人都是源自一个共同的古老人类祖先种群。

但尼安德特人与现代人类之间有许多相似之处，而这些特征并未出现在东亚人群中。他们共享中旧石器时代石器技术，即勒瓦娄哇技术——这是一种认知上独特的制石工艺，在东亚地区并未使用。此外，两者的线粒体DNA和Y染色体序列也完全相同。

实际上，尼安德特人的Y染色体序列和现代人类的线粒体DNA，都源于约20万至30万年前通过杂交传入尼安德特人群体的现代人类遗传成分，并迅速扩散至接近100%的频率。尼安德特人和现代人类都是远古与现代人类之间发生混合事件的结果，这一结论可通过古代和现代DNA中的变异模式得到明确验证，时间大约在30万至20万年前。

尽管全基因组数据表明丹尼索瓦人与尼安德特人密切相关，但感觉上尼安德特人与现代人类之间似乎存在某种独特联系，而这种联系并不存在于丹尼索瓦人中。这让人不禁思考：是否存在某种机制将尼安德特人与现代人类更紧密地联系在一起，即使从整体基因组来看，丹尼索瓦人与尼安德特人仍聚为一类？这个问题我一直在反复思考。

Dwarkesh Patel

那么，这种联系是否可能源于杂交事件，或者他们曾在同一时间身处同一地点而我们未能察觉？

David Reich

已知有一条从现代人类谱系向尼安德特人方向的杂交事件，但其贡献比例仅为约5%。

我感兴趣的是这样一种可能性：这5%的比例或许并非表面所见，而是暗示着更深远的意义——也许尼安德特人在某些方面远比我们想象的“现代”。即便他们的基因组被大量古老基因淹没，他们对现代人类的影响可能远超预期。《中旧石器时代》和《中更新世革命》所代表的文化与技术飞跃，或许本质上就是尼安德特人自身的一部分，只是我们尚未充分认识到这一点。

Dwarkesh Patel

有趣。抱歉，请问这次杂交事件发生在什么时候？

David Reich

大约30万至20万年前。

Dwarkesh Patel

所以，尼安德特人与今天大多数活着的现代人之间的共同祖先，其年代可能比所有活着的人的共同祖先还要近。

David Reich

没错，确实如此。

Dwarkesh Patel

这太疯狂了。

David Reich

其实，包括丹尼索瓦人在内的所有古老人种的分离，都在人类遗传变异的正常范围内。

Dwarkesh Patel

等等，什么？

David Reich

是的。任意两个人类基因的共同祖先的平均时间是在一百万到两百万年前。如果你看看你从母亲那里继承的3号染色体副本和从父亲那里继承的3号染色体副本，它们共享共同祖先的典型时间也是一百万到两百万年前。这早于与尼安德特人和丹尼索瓦人的分化。因此，在你的DNA中有很多地方，你与你母亲一方的尼安德特人比与你父亲更亲近。

Dwarkesh Patel

我确信有简单的解释，但怎么做到的呢？

David Reich

原因和你有一个姐妹时一样：在你DNA的一些地方，你与她比与我更亲近，因为你们共享一个父母；但在其他地方，你与我比与她更亲近，因为你碰巧没有从父母那里继承相同的DNA。

只是我们从共同祖先种群继承的DNA在一百万年前、七百万年前、五百万年前就已经相当多样化了，有些人继承了某些祖先的DNA，而其他人则继承了其他祖先的DNA。尼安德特人与我们这一支系在人类进化的时间尺度上非常接近，以至于在我们DNA的一些地方，我们与尼安德特人的关系比彼此之间更亲近。

Dwarkesh Patel

有趣。其他重要问题是什么？

David Reich

这是我最近一直在思考的主要问题。我仍然非常关注关于人类在全球范围内人口扩散的问题，并试图通过古代DNA重建这一过程。

我最近一直在思考的一个问题是：也许我们看待古代人类与现代人类关系的方式是错误的。标准模型认为：这些通过古代DNA发现的古代人类——丹尼索瓦人和尼安德特人——从一个大约50万到60万年前的共同祖先种群演化而来，这两个群体大约在70万到80万年前就从现代人类的祖先——像我们这样的人——分离开来。这是自2010年以来许多研究的重要成果。

但也有证据表明，大约20万到30万年前发生了一次杂交事件，导致现代人类向尼安德特人的祖先贡献了DNA。因此，尼安德特人DNA中可能有5%来自这次杂交事件，许多研究已经证明了这一点。我对这个问题很感兴趣，因为在考古记录中，尼安德特人和现代人类看起来非常相似，彼此之间的相似程度远高于他们与东亚的这些古代人类——丹尼索瓦人之间的相似程度。

长期以来，人们一直认为尼安德特人是我们的姐妹。但在2010年，丹尼索瓦人基因组的测序结果明确显示：平均而言，丹尼索瓦人与尼安德特人的关系比与现代人类更近。这是一个令人困惑的结果。现在大多数人认为：尼安德特人和丹尼索瓦人从一个更早分离出来的共同祖先种群演化而来，这个种群大约在70万到80万年前就从现代人类的祖先分离开了。

我对一个观点很感兴趣：或许我们应该把尼安德特人看作某种意义上的文化现代人，尽管他们的基因主要来自丹尼索瓦人。我思考的模型受到一个考古现象的启发，即中石器时代革命。如果这是非洲，这是欧洲，我们知道这种新的石器制作方式——使用从远离使用地点的地方精心开采的石核，材料为燧石等优质石材——大约在30万到40万年前开始使用，最早出现在高加索地区，比如今天的格鲁吉亚或东非。

这种石器制作方法极具革命性。在欧洲被称为中旧石器时代，在非洲则称为中石器时代，它与火的使用范围大幅扩展以及石器运输距离显著增加密切相关。

我关注的一个想法是：现代人和尼安德特人之间存在某种共享的文化特征，而这种特征在东亚地区却缺失，可能与遗传数据有关，也与那5%的DNA片段存在关联。

我所感兴趣的设想是：可能存在一个群体，他们发明了中石器时代和中旧石器时代的石器技术，有时也称为勒瓦娄哇技术；这个群体的人群扩张进入欧洲，并与当地的古老人类发生混合——这就是那次5%的基因渗入事件。这一过程发生在20万至30万年前。由此产生的人群在遍布欧洲的区域内扩张时，主要继承了当地古老人类的基因，因此在基因上变得以古老型为主，但仍保留了现代人的文化特征，包括这种石器制作技艺和某些传统习俗。

有趣的是，若观察全基因组层面的遗传学数据，会发现尼安德特人与丹尼索瓦人聚为一类。但若查看线粒体DNA（人类和尼安德特人都从母亲那里继承），则尼安德特人与现代人聚为一类。再看Y染色体（从父亲继承），丹尼索瓦人与现代人拥有超过70万至80万年前的共同祖先，这与历史背景相符。

然而，若单独分析尼安德特人的线粒体DNA，其年代仅为30万至45万年；Y染色体的年代也在此范围内。当前遗传学研究要求我们相信的是：尽管这仅占整个基因组的5%，但它却引入了线粒体DNA和Y染色体，并使它们在种群中达到100%的频率。这听起来有些疯狂，因为随机发生的概率极低，可能只有5%乘以5%，是一个非常小的数值。虽然我们实际上都接受这一结论，但从基本原理来看，仅凭5%的基因渗入就同时带来Y染色体和线粒体DNA，仍显得极不寻常。

事实确实如此。西班牙一个距今30万至40万年的遗址——“死者之坑”（Sima de los Huesos）提供了惊人的数据。该遗址的核基因组大部分呈现尼安德特人特征，但其线粒体DNA和Y染色体却与丹尼索瓦人相似。这表明，与现代人类相关的种群曾侵入并取代了这个“死者之坑”类型的群体，替换了其线粒体DNA和Y染色体，但保留了其余基因组。这似乎就是真实发生的情况。

我正在思考的一个观点——或许它是错的，谁知道呢——是存在一种景观……这里是欧洲，可以划分为约一百个微小的地理单元（即“demes”）。现代人类最初出现在右下角，也就是中东或附近地区，然后向欧洲扩散。随着这个种群的扩张，会形成一个扩张前沿，并与当地的古老人类互动。

模拟研究以及哺乳动物、鸟类等不同物种的研究表明，即使存在少量杂交——当一个群体入侵或扩张进入另一个群体的领地时——也会发生大规模的基因渗入。处于扩张前沿的先驱者有时会与当地人群杂交。由于他们数量众多，其DNA会被当地群体的基因淹没，因此当他们抵达另一端时，实际上已经高度本地化。

也许这正是我们观察到的现象。例如，假设有一个母系传承的现代人类群体，他们通过这种方式将石器制造技术从母亲传给子女。因此他们保留了自身的线粒体DNA，但当其穿越整个欧洲后，最终却主要与当地古老人类融合。结果便是95%的人口更替。这可以解释为何尼安德特人与现代人类的线粒体DNA存在共享，同时也能说明为何混合比例仅为5%。

更有趣的是，现代人类自身也存在混合证据。正确理解方式是：现代人类由两个在约150万年前分化的群体混合而成，大约在20万至30万年前重新结合，其中约20% ancestry来自某个古老的非洲群体，80%则来自早期现代人类谱系。随后，这一群体又与尼安德特人混合，形成5%现代成分与95%本地古老成分的格局。

实际上，正是这个关键群体创造了中石器时代或勒瓦娄哇技术。他们在20万至30万年前出现并向四面八方扩张——包括进入欧洲和非洲——带来了这种技术、新思想，或许还有某些遗传适应特征。他们在欧洲与古老人类混合，最终被95%地取代，但仍保留其文化特征，甚至部分遗传特征。

他们也在非洲扩张，但这里的替代程度仅为20%而非95%。原因很可能是该群体分化时间更早——长达150万年，而非欧洲的70万至80万年。因此，基因不兼容性和基因流动障碍更多，但仍发生了大量混合，可能达到20%，而我们已有证据表明这是一个重大的混合事件。

你所看到的，实际上是现代人类向欧洲和非洲的扩张。在某一地区，他们演化出尼安德特人；在另一地区，则形成了今天所有人的祖先。但所有这些群体都源自这里发生的一次关键性革命事件。

我们常讨论的是距今5万至1万年前那场革命性的变革——象征性行为等首次出现在非洲和中东，并逐渐传播开来。然而，还存在更早的一次事件，它与当今非洲各族群的分化（如科伊桑人和中非雨林狩猎采集者）同时发生。人们不禁要问：这是否同样是一次塑造性的重要事件？

如果确实如此，那么我们就应将尼安德特人视为某种意义上的“表亲”。他们共享Y染色体、线粒体DNA，也共同经历了这一距今约二十万至三十万年前的事件，甚至拥有相似的工具技术。尽管基因组数据显示他们与丹尼索瓦人是近亲，但从某种重要意义上讲，或许更准确地说，他们其实是现代人类的近亲。

Dwarkesh Patel

我有很多问题。你还有15分钟吗？首先，关于这群生活在150万年前的古老非洲人群，究竟发生了什么？他们在非洲的哪个区域？那些没有演变成现代人的部分后来怎样了？他们是否幸存至今？

David Reich

这并非来自古代DNA数据，而是基于对现代人（主要是非洲人，也包括非非洲人）的现代DNA分析得出的结论。多项研究——至少有三到五篇我已了解的研究——通过观察当代人群的变异模式发现：包括非洲人在内的现代人遗传数据并不支持一个单一均质种群的存在。

相反，数据表明该群体早在超过一百万年前就已分化为多个支系——至少两个，可能更多——然后在几十万年前重新汇合。不同论文提出了各自的模型拟合方式，但都一致显示出这样一个特征：即超过百万年前的大范围分裂，随后在大约数十万年前出现再混合事件，最终形成解剖学意义上的现代智人祖先。

Dwarkesh Patel

这其中是否包含科伊桑人及其他族群？

David Reich

是的。所有这些群体都带有这种遗传印记，只是比例略有差异。于是你会追问：这些人当时生活在哪里？谁知道呢？在这个模型中，那80%的祖源成分来自高加索或东北非地区，也就是中石器时代兴起的地方。正是这个群体带来了中石器时代的文化和技术。他们与当地人群混合，至于这些本地人群身处何方——南、西、中或东非——就不得而知了。

我们目前尚无古代DNA证据，但该地区环境极为丰富。人类至少在七百万年前就开始在此生活，各地必然存在不同的群体。很可能不止两个群体，数量应该更多。

关键在于，这里有超过百万年的深层亚结构证据。这片土地曾遍布各种古老人类，他们与向外扩张的人群关系各异，并在后者迁徙过程中与之发生混血。

Dwarkesh Patel

所以尼安德特人第一次出现是在30万年前，我们的祖先与他们共享文化。他们共享中石器时代的技术，但并没有取代当地人口。这种技术主要通过文化传播扩散。

大卫·赖克

它同样通过基因传播。如果你看看印度地区的颜那亚人（Yamnaya），会发现那里几乎没有颜那亚人的血统，只是被稀释了。随着颜那亚人向中亚和欧洲扩张，他们创造了绳纹陶文化（Corded Ware）。在这个过程中，血统被稀释了约25%。然后颜那亚人再次从中亚扩张，穿过兴都库什山脉进入南亚北部，与当地人群进一步混合。如今，印度人身上最多能检测到20%或10%的颜那亚血统，大多数人则低于10%甚至5%。

虽然途中发生了大量混血，但它仍然是追踪印欧语系和印欧文化重要特征的“示踪染料”。如果你知道该往哪里看，这种“染料”在一些群体中只占10%、5%甚至2%。但正是人们所说的语言以及重要的共同文化元素，将他们与印欧语世界另一端的人群联系起来。所以这5%绝不能轻视——在这个模型中，它正标记着一些重要信息。

德瓦克什·帕特尔

我理解如果某些东西更多是通过女性传播的……抱歉，让我先理清思路。我不明白为什么在传播过程中，母系线粒体DNA和Y染色体会特别“受青睐”。你能解释一下吗？

大卫·赖克

我之所以讨论母系或父系扩张，是因为多年来我一直对此感到困扰——尤其是最近三四年——线粒体DNA和Y染色体显示尼安德特人与现代人聚为一类，而其他基因组区域却显示尼安德特人与丹尼索瓦人更接近。

这是一个在其他物种中从未见过的奇怪结果。我非常希望找到能解释这一现象的模式。如果我们假设存在母系或父系扩张——可能是其中一种——那么当现代人类在欧洲大陆扩张时，他们在某一条谱系上保持了身份认同。

如果是母系扩张，当他们接纳当地男性加入社群时，这些男性会被纳入以母亲文化为主导的家庭；反之，如果是父系扩张，当地女性则会按照父亲的文化传统抚养子女。这样一来，就能保证基因组中某一部分呈现出当前的样子，因为它代表的是现代人类的扩张。如果是父系社会，就会保留Y染色体；如果是母系社会，则会保留线粒体DNA。这样至少能解决你提出的一个问题。

德瓦克什·帕特尔

但不能同时解决两个问题。

大卫·赖克

确实无法同时解决另一个问题，因此你需要另寻他法。你可以通过自然选择或社会选择来解决这个问题。顺便说一句，父系或母系传承在人类社会中是普遍现象，而非例外。通常社群会在男性或女性谱系上保持连续性，多数情况下是父系，有时是母系。

也可能存在社会选择现象。例如，一旦某个孩子的父亲来自外部群体……在大多数社群中，女性都会生育后代，这在今天很常见。通常只要女性有能力就会生孩子。但在传统社会中，男性的生殖成功率其实差异很大——相当一部分男性终生无子；而另一部分男性则与多位女性生育多个子女。

男性之间会为争夺子女展开竞争。在这种背景下，当雄性为获取雌性交配权而竞争时，雌性的配偶选择就成为一个关键过程。会出现这样一种现象：如果你的父亲是远古型男性，那么你在争夺本地雌性时的成功率可能不如父亲是非远古型男性的个体。

这类简单的社会现象或许就能解释数据，而我们在人类社会中也确实观察到类似情况。比如我记得在中非雨林地区的狩猎采集者中，男孩和女孩会受到不同对待，这取决于其父母属于哪个群体。

Dwarkesh Patel

我不太明白母系……这个群体是如何传播的，并到达下一个前沿的。他们生了孩子。从刚进入的人类那里，孩子会继承线粒体DNA；但从现存人群中，孩子却继承了远古人类的线粒体DNA。为什么携带远古人类线粒体DNA的人没能存活下来？

David Reich

这是个问题。有多种可能的解释，但比起同时解释线粒体DNA和Y染色体要容易得多。一种可能是这些线粒体DNA生物适应性较差；另一种可能是基于父母是否为远古人类而产生社会歧视——这在人类社会中并不令人意外。这是整个论证中最薄弱的环节。这个论证很可能是错的，我只是想告诉你我在思考什么。

Dwarkesh Patel

好的，关于尼安德特人。所以30万年前我们的谱系与他们接触，但主要是他们的谱系延续下来，并发生文化和基因交流。那7万年前我们再次接触时呢？

David Reich

是的。

Dwarkesh Patel

但他们没有延续下来。

David Reich

遗传谱系没有延续下来。

Dwarkesh Patel

遗传谱系没有延续下来。可以推测在30万年前到7万年前之间还有其他接触。

David Reich

很可能有。但我们目前检测到的就是这些。

Dwarkesh Patel

是否只是偶然——一次出现这种程度的基因扩散（大部分远古基因组得以保留），另一次则是完全替代？

David Reich

考虑到背景，这完全不令人惊讶。如果你思考这个模型，这是70万或80万年前的事，而这是30万年前，两者相隔40万年。你之前跟我提过Bhatia的那篇论文，那是两个种群相隔7万年。西非人和欧洲人之间没有生物学不兼容性，也没有自然选择反对生物学不兼容性。

我们知道尼安德特人和现代人在相遇并混合时存在生物不相容性，那是在70万年前。随着种群进一步分离，生物不相容性迅速加剧，可能呈分离距离的平方增长，因为需要成对的相互作用基因。而此处，这条谱系与那条谱系的分离时间可能只有40万年。但这里是120万年，差距巨大。它们已接近无法生育后代的地步。这些人类彼此差异极大。实际上，它们的分离程度是这三者中最近的。

若观察当今人类的混合现象，在南部非洲就有相距仅一半距离的人群混合。例如科伊桑人与班图人的混合，像科萨人（纳尔逊·曼德拉所属的族群），这两个群体相隔近二十万年，仅为这里的二分之一。他们完全兼容。

你所看到的是一个在遗传上几乎完全通透的群体。另一个则极可能存在显著的生物不相容性。因为在两到三十万年后，我们观察到尼安德特人与现代人、或丹尼索瓦人与现代人之间的杂交，当时已有明确的不相容证据。而这里的差异更大。

你预期会看到的是：随着这个群体扩散，他们会进入布满古老人类的领地。虽会有部分杂交，但后代适应力差，难以存活。不育现象普遍。基因流动与杂交的障碍将更大。

对我来说，当这个群体进入欧亚大陆时，遇到的是丹尼索瓦人的祖先——仅与我们这里的人相差四百万年；而非洲古老人类则相差一千两百万年——他们之间杂交较少，基因交流也少，这并不令人意外。

关键在于时机。时间一致。这强烈暗示着来自同一地点的一群人同时与这两地人群互动。同样的文化或技术革命正在影响两地，催生受此文化变革影响的群体——而我们确实知道这一点，因为他们共享相同的工具组合。

有人主张勒瓦娄哇技术是独立发明的。但它非常相似，而这个模型正说明它可能有共同起源。因此存在一条文化上的纽带——共享的工具组合；一条线粒体DNA和Y染色体的纽带；以及一条时间上的纽带——两者都通过混合形成。

Dwarkesh Patel

否则你就得相信尼安德特人是独立发展出石器时代工具的。

David Reich

是的，这并非不可想象。但这有点像相信农业在世界多地独立发展——虽然确实如此。

Dwarkesh Patel

没错，确实如此。

David Reich

确实如此。所以如我所言，这个观点很可能是错的。我只是想告诉你，我们对所处的世界其实知之甚少。这个说法未必明显错误。事实上，在我看来，它比我们现在所写的模型更合理。它可能是错的，但远比其他假设更可信。它能解释更多现象，且复杂程度相当。

Dwarkesh Patel

你想再回顾一下你关于托勒密和本轮类比的说法吗？我觉得那很有意思。

David Reich

我认为我们共同构建的关于古代人类与现代人类之间关系的模型是随着时间推移逐渐形成的。起初，人们认为现代人类是独立的群体，而尼安德特人和丹尼索瓦人是近亲。后来，我们又发现了更多混合事件——比如现代人类基因流入尼安德特人，以及其他一些我都没提到的复杂情况，例如某个高度分化的谱系进入丹尼索瓦人等。即便如此，我们仍然会说：“哦，整个基因组显示尼安德特人和丹尼索瓦人是姐妹群，所以这就是真相。”

我们把所有这些碎片拼凑起来，让它们都能运行起来。当你查看线粒体DNA和Y染色体时，会发现一种奇怪的分布模式，虽然概率很低，但只要引入自然选择等因素，就能解释得通。总之，就是把所有东西都拼凑在一起。

这让我想起了古代天文学的情况：当时人们认为太阳绕地球转，但这并不能很好地解释行星的运动。为了准确描述行星运动，托勒密等天文学家提出了“本轮”的概念——即一系列额外的旋转和轨道来拟合观测数据。这个模型非常复杂。而当哥白尼等人提出所有天体都围绕太阳运行时，事情就简单多了。

实际上，随着天文数据的积累，旧模型不断出现矛盾，于是只能通过不断增加新的复杂性（比如更多本轮）来勉强维持。这不像日心说那样大胆，但比原来的地心说模型要简洁得多，而且能解释更多现象。

Dwarkesh Patel

那么，这个替代模型中有哪些反直觉、令人意外或难以接受的地方？人们为什么犹豫不决而不采纳它？

David Reich

我不知道。目前没人真正思考过这个模型。对我来说，它看起来显然是一个非常自然的模型。

Dwarkesh Patel

我这么问是因为古希腊的阿里斯塔克斯曾提出日心说，因为他已经推算出地球到太阳的距离，并注意到其他现象。但他的理论没有被采纳，因为雅典人反驳说：“如果地球真的绕太阳转，那么我们不可能看不到恒星相对于地球的明显移动，唯一的解释就是恒星离我们太远，远到无法想象，因此这种说法不可信。”于是日心说被否定了。

我想问的是，在这里是否存在类似的困境——“为了让这个理论成立，某种条件必须极端到不可思议的地步”——但实际上那种条件确实存在？也许我们应该接受这个理论带来的看似不合理却可能是真实的推论。

David Reich

这是个很好的问题。我认为我们必须假设非洲与欧亚大陆在这一时期的文化转型之间存在联系，但目前学界还没有将遗传数据与此联系起来加以整合。

遗传学领域关于非洲人群亚结构的研究中有一个讨论帖，同时还有一个基于古DNA的庞大世界体系，但这两者从未被整合起来。没有人将现代人类亚结构的现有广泛研究与基于古代DNA、关于古老人类与现代人关系的大量研究结合起来。

如果将它们结合起来看，你会发现它们在亚结构发生的时间上是一致的。我不知道这是否不太可能，但从我的角度来看，这似乎是最简洁的解释。

Dwarkesh Patel

值得注意的是，当时不同的人类群体都具备了采用石器时代技术的能力。一旦某个群体掌握了这种技术，不同人类谱系之间的遗传差异并不至于大到无法教会其他人如何使用石器工具。

David Reich

谁知道呢？这可能是受遗传因素驱动的。我们之前讨论过人类基因的共同祖先时间。在10万或15万年前没有明显变化，但在40万或50万年前却有很多关键节点。

如果真是这样，假设某个突变发生在高加索地区、中东或东北非洲，就可能存在关键的遗传突变，使人们具备这种能力。随后这个种群开始扩张，当它进入欧洲时，会被当地基因淹没，但在扩张过程中仍可能通过自然选择保留这些基因。

也许你所看到的是遗传上的发展。大多数讨论都集中在5万到10万年前的"解剖学现代人行为"事件上，但许多考古学家认为，从很多方面来看，30万年前左右的事件同样——甚至更加——意义深远。为什么我们不谈这个事件呢？

Dwarkesh Patel

你是在说现代人与5万年前的人之间没有固定的遗传差异。那么，5万年前的人和30万年前的人之间是否存在固定的遗传差异呢？

David Reich

我认为存在。

Dwarkesh Patel

除了明显的杂交现象之外。

David Reich

如果你观察30万到40万年前的遗传变异，确实开始出现所有现代人共有的祖先谱系。换句话说，在那个时间深度开始出现固定差异。这正是你可以开始看到固定差异证据的时候。

如果所有人都在40万到50万年前拥有共同祖先，这意味着当时存在一个单一的祖先。如果与其他种群比较，它们会来自不同的谱系，因此在这个单一祖先之前发生的任何突变都会成为固定差异。这就是你能开始看到固定差异的时间点。

Dwarkesh Patel

但解剖学上的现代人、认知上的现代人早在旧石器时代中期之初就已经存在，早于我们与这些非洲古代人群或与尼安德特人杂交之前。

David Reich

解剖学上的现代人正好出现在这里。时间完全一致。就是在这个时候出现的。具有我们骨骼特征的人和尼安德特人也是在同一时期出现的。

所有这一切都发生在这一时期。在骨骼记录中，解剖学上的现代人和行为学上的现代人之间存在脱节，后者出现在5万到10万年前。解剖学上的现代人出现在这一时期，可识别的尼安德特人也大致在同一时期出现。

Dwarkesh Patel

有意思。但我们不清楚，在20万年前到5万年前这段时间里究竟发生了什么——如果真有什么变化的话——使得人类从解剖学上的现代性过渡到行为学上的现代性。

大卫·赖希

我的理解是：没有。他们花了20万年时间制作类似尼安德特人那种勒瓦娄哇石片工具，而且在任何明显方面都不比尼安德特人更出色，据我所知就是这样。

随后，考古记录开始出现一系列快速涌现的行为特征，这些特征可能完全不是遗传因素导致的，也可能是遗传的。对此有很多争论。我们之前讨论过，人们曾特别关注智力问题。如今大家又热衷于艺术这类对我们而言似乎很重要的东西，但谁知道什么才真正重要呢？

德瓦尔克什·帕特尔

有趣。谢谢你的补充说明，很精彩。

大卫·赖希

我参与的研究工作一再表明，我在研究之初所抱有的偏见是完全错误的，这让我深受打击。一次又一次，我带着某种假设进入项目，结果数据却否定了它。

举个例子，当我参与尼安德特基因组项目，帮助分析古老尼安德特人与现代人亲缘关系的数据时，我和一群科学家都认为，非非洲人群只是非洲人群遗传变异的一个简单子集，并且没有任何证据表明尼安德特人或其它古老人种曾与现代人的祖先发生过杂交。我之前和其他许多人做过的不同分析也显示，非非洲人群的变异完全可以归结为非洲人群的一个小样本，这足以解释所有数据。

然而，在分析尼安德特人的DNA序列时，我发现了一个强有力的证据：尼安德特人与非非洲人比与非洲人更为接近。这非常令人惊讶，我一度认为这可能是错误的结果。我当时相当难以置信，因为此前其他证据似乎指向相反的方向。于是，我和同事们花了数年时间试图推翻这些结论，但始终无法做到。这些结果反而越来越强有力。

在自然选择方面的研究经历也是如此。我们原本确信，在过去几十万年中，我们的物种几乎没有受到自然选择的显著影响。因此，如果我们观察今天非非洲人或其他任何人群的遗传变异模式，应该看不到太多正在进行的自然选择信号。事实上，最早的古代DNA研究（始于2015年我与伊恩·马西森及同事合作的那篇论文）似乎也显示出与自然选择相关的基因位点数量相对较少。

2015年，我们分析了约200名欧洲人和中东人的数据，试图了解基因频率随时间的变化。我们将这些古代人群作为现代欧洲人的祖先来源，与今天的欧洲人进行比较，并关注那些差异极显著、不可能是偶然产生的频率变化。我们非常兴奋地发现，有12个位点的频率在现代欧洲人与基于历史推断的预期值之间存在显著差异——其中部分位点已被已知，而另一些则是新发现的，这令人十分振奋。

我们希望随着样本数量的增加以及分辨率的提升，能够更细致地捕捉到频率随时间的变化，从而检测到更多差异。然而，在接下来的十年中，这一期望并未实现。例如，2024年由哥本哈根团队开展的一项同类最大规模研究使用了比我们2015年所用数据质量更高的数据，但仅发现了21个在时间跨度上表现出高度差异的位点。虽然这一结果令人鼓舞——几乎是2015年发现数量的两倍——但从许多方面来看仍令人失望，因为尽管样本量和数据质量大幅提升，最终发现的差异却依然有限。

这表明我们可能正接近一个极限（asymptote），难以突破当前水平。理论上极具前景的研究方法——通过分析基因组频率变化来理解生物学机制——似乎并未带来预期的高回报。也许自然选择处于静默状态，我们所观察到的变化如此之少，是因为过去几千年中并未发生强烈的适应性方向性选择。这种情况一直持续到几年前，在我们由阿里·阿卡巴里（Ali Akbari）领导的研究小组开展的一项研究中才有所改变。

为此，我们引入了一些创新方法来增强检测自然选择的能力。其中之一是大幅增加数据量，使系统处理的数据量提升了约14倍。本研究的核心贡献在于报告了来自约1万名个体的新数据，这在文献中是一个巨大的飞跃。目前，覆盖过去18,000年的古代个体总数据集约为16,000人，而本次研究的样本量远超此前任何研究。数据越多，就越能更精细地估算频率的微小变化。

这些数据仅来自世界的一部分地区——欧洲和中东。这并非比其他地区更重要，但由于历史原因，目前古DNA文献中70%至80%的数据来源于此区域。它为我们提供了一个天然实验室，让我们可以观察环境变迁过程中某一特定地点的基因组如何随时间演变。想象在其他地区进行类似分析无疑极具启发性，比较性研究也极为重要且引人入胜；但目前这项研究聚焦于我们拥有特别丰富数据的这一特定地理区域。

我们做的另一件事是开发了一种全新的方法论，此前从未在该领域使用过。这种方法的理论基础是用于医学研究中寻找疾病风险因素的技术。简单来说，它解决的问题是：如何根据一个人与其他人的亲缘关系模式来预测其遗传类型。我们的数据集包含约1.6万名古代人，若加上现代人则达到2.2万人。接着，我们分析这2.2万人彼此之间的亲缘关系紧密程度，并基于他们与其余2.2万人的整体亲缘关系模式，预测DNA中每个位点（共1000万个位点）的遗传类型。

然后我们进一步探究：如果自然选择在各地域和各个时间点都朝着同一方向改变突变频率，是否比仅依据数据库中所有样本的亲缘关系更能更好地解释数据？我们只是提出一个替代假设——即选择始终以相同方向作用——看它是否能更优地拟合观测结果。这显然是一个过于简化的假设，因为事实上自然选择的强度会随时间变化。但我们只是想回答一个最基本的问题：假设选择速率恒定是否比不假设更能解释数据？

Dwarkesh Patel

总结一下，确保我理解正确：你试图建立一个模型来预测等位基因频率随时间的变化。这个模型包含两个部分。一是遗传相关矩阵，它反映了不同基因组之间的相似性，从而捕捉瓶颈效应、遗传漂变、种群混合等影响整个基因组的全局性事件。

另一个部分是：当我们聚焦于特定基因组位置时，是否可以认为“该位置在时间推移中以某个系数受到正向选择”？如果我们加入这样一个选择系数，是否比仅仅依赖前述由全基因组背景（如是否经历相同瓶颈、漂变等）所决定的“人工效应”更能准确预测等位基因频率的变化？

David Reich

完全正确。

Dwarkesh Patel

好的，那我们从中学到了什么？

David Reich

通过这种方式分析数据后，我们在2.2万名个体（其中1.6万为古人）的DNA中共考察了1000万个位点，检验是否存在超出随机预期的、持续一致的方向性变化。结果发现，有数百个DNA位点的变化幅度过大且方向过于一致，无法用偶然因素解释。

要确定这些突变位点的数量存在一定的统计难题，因为它们分布过于密集，彼此之间距离很近且相互干扰。但当我们尝试将它们区分开来，并说“只计算DNA中每个位置的一个，其余的忽略”时，我们发现至少有479个独立的位置都在以相同的方式施加影响。我们有99%的把握认为这些位置是真实存在的。根据另一个标准——有超过50%的把握它们是真实的——我们认为大约有3800个位置都在朝同一方向施加影响。考虑到我们之前的工作和其他人的研究最多只能从单次扫描中发现几十个结果，这是一个惊人的数字。

所以当我们得到这个结果时，我们非常惊讶。我们认为这一定是错的，于是花了接下来的几年时间试图让这些结果消失，但它们却越来越强。我们一直在寻找某种独立的证据来告诉我们这些位置是否真实存在。我们偶然发现了一种前所未有的强大方法，非常适合这个目的。它依赖于这样一个事实：我们发现了大量的突变位点，有数百个甚至数千个之多。

我们采用了一个完全独立的数据集，即全基因组关联研究的文献库。这些研究在数十万人的群体中进行，寻找特定基因突变是否在高血压患者中比在低血压患者中更常见，或者类似的情况。我们使用了英国生物银行（UK Biobank），其中包含约50万名来自英国的个体，他们被测量了数百个性状。所有这些人的全基因组都已被测序。对于这些性状中的每一个，我们都可以查看这1000万个位置中的每一个是否以令人信服的方式与该性状相关。在这1000万个位置中，约有15%——即大约150万个DNA位置——至少能预测其中几百个性状中的一个。

然后我们可以提出一个问题：我们的自然选择信号，即我们的统计量，是否与某个突变导致高血压或其他性状有关？我们将自然选择的统计量向上滑动，设定为1、2、3、4或5的值。随着这样做，影响性状的基因突变的富集程度越来越高。虽然在不使用我们的选择统计量时只有15%，但当要求选择统计量高于大约5时，导致性状的突变的富集程度增加了五倍。

Dwarkesh Patel

抱歉，什么是选择统计量？

David Reich

这是我们用来衡量一个突变是否以非零方式显著随时间变化的统计量。它可以近似看作一个正态分布的统计量，即高斯统计量，表示统计值距离零有多少个标准差，其中零代表没有自然选择。

不完全是这样，但很接近。如果统计量高于五，我们会观察到约五倍的突变富集，这些突变会影响某一性状。原本随机影响该性状的突变比例是15%，但当我们的统计量上升时，这一比例会达到60%或70%。这为这些位点的真实性提供了完全独立的证据；而当统计量超过五后，就不再有进一步的富集现象。我们对这些结果的解释——通过计算机模拟验证并证明其合理性——是：一旦统计量超过五，自然选择信号本质上都是真实的。

Dwarkesh Patel

好的，为了确保我理解正确。你的意思是，为了确定哪些等位基因受到选择，你的模型会给每个等位基因分配一个统计量，比如“要解释这个等位基因为何具有特定频率，我们将赋予它一个选择统计量”。与此同时，我们在现代人群中进行独立研究，比如“如果你观察身高、眼睛颜色、智力或其他性状，基因组中哪些区域与这些性状相关？”你在研究中赋予某个区域的统计量越高，说明该区域在解释等位基因频率随时间变化（由选择引起）方面越重要，那么该基因组区域就越可能与可测量的功能性性状相关。

David Reich

完全正确。这是阿里提出的一个绝妙想法。它摒弃了传统方法——即通过统计显著性来判断导致性状的突变，而是利用外部信息——即与性状的相关性（以完全不同的方式测量）——来评估突变是否真实存在。

我们可以根据特定的选择统计量，计算真实信号的富集程度。如果富集程度达到峰值的一半，正确的解读是：50%的突变确实受到了选择；如果达到四分之三，则有75%的概率该突变是真实的；如果达到99%，则有99%的概率它是真实的。这为我们提供了一个校准后的估计值，用于判断某个特定位置是否真正处于自然选择之下。

这里的一个主要担忧是：我们观察到的现象可能并非这些突变真的受到选择，而是两者都源于第三种共同因素——即所谓的背景选择：针对新出现的有害突变的清除过程，这类突变通常集中在基因中。而基因也恰好是基因组中与性状关联最密切的部分。这种普遍存在的过程既导致了性状信号的富集，也导致了我们所观察到的选择信号的富集。这正是我们所担心的。当时我们对此非常忧虑。

所以我们所做的就是在所有区域都受到相同程度背景选择的DNA片段中重复这种富集分析，这些区域就像被轻微有害突变“雨”淋过一样，结果我们得到了完全相同的模式。我们还重复了这个实验，只是使用了频率相同的突变，因为不同频率下检测这些信号的统计能力是不同的。我们看到同样的模式：当选择统计量值超过五左右时，就会出现平台期。

Dwarkesh Patel

让你生成序列的数量增加两个数量级的是你用来识别人类部分所使用的统计方法吗？或者2014年以及此后到底发生了什么变化？

David Reich

已经有一系列改进。主要的变化之一是测序成本的巨大下降，这使得生成古代DNA成为可能。自20世纪90年代末以来，成本下降了百万倍，从2010年到今天又下降了大约一到两个数量级。这是一个巨大的变化。

另一个变化是溶液富集法。这种方法可以将含有极低比例人类DNA的样本转化为一种过程，使得分析的序列中绝大多数对人类DNA有用。我们采用的方法是：我们取了一些DNA样本，其中大部分人类DNA的比例非常低——不到10%，通常不到1%——这种比例太低，在当时的技术条件下，对其进行测序并强行测序的成本高得令人望而却步。

我们将这些样本过筛到一组人工合成的短DNA片段上，这些片段针对的是我们感兴趣的DNA位置。这些位置超过一百万个，在人群中高度可变，我们选择其中许多是因为它们具有生物学意义。我们有一整套已知的生物学靶点，这些靶点在基因组关联研究中会影响性状，也就是人们寻找现代人中特定遗传变异是否对表型和性状有特定影响的方法。

因此，我们所做的就是将这些人工合成的DNA片段过筛我们的古代样本，它们结合了我们靶向的DNA部分。生成的序列极大地富集了关于历史的基因组信息部分。尽管只有10%或1%的DNA是人类DNA，但最终很大一部分来自我们感兴趣的基因组部分，这使得该方法在经济上变得高效。

Dwarkesh Patel

那另外99%的DNA是什么？

David Reich

主要是微生物DNA。它来自细菌和真菌，这些微生物在人死后会定植于其体内。根据死亡方式的不同，这些细菌和真菌的数量会有所不同。当你通常对一个人的DNA进行测序时，它会充满微生物序列。有时微生物序列非常有趣；它可能是导致这个人死亡的病原体。例如，有一些惊人的工作，比如从人牙齿和其他身体部位中提取的病原体序列，揭示了不同的疟疾、黑死病、乙型肝炎等疫情。

但我们这里关注的是人类DNA。这一变化使得每年可产生的数据量从几十份提升到几百份，随后我们进一步对流程进行机器人化和工业化改造，使年产量达到数百甚至数千份。仅在我们实验室，每年就能从超过5,000名个体中生成基因组规模的数据。我知道世界上其他几家实验室现在也做到了这一点。

这种巨大的数据飞跃——在某些情况下甚至是半指数级或超指数级的增长——使我们得以提出并回答新的问题。2010年时，人类基因组序列的数量还只有约10个，而今年已公布的序列数就超过了20,000个。数量级上有了几个数量级的提升，2014年我们能够提出的问题，与今天相比已经完全不同了。

Dwarkesh Patel

太棒了。非常好。大卫，谢谢你抽出时间。

David Reich

谢谢，Dwarkesh。

需要完整排版与评论请前往来源站点阅读。