🤖 AI / ML

开源权重模型正在悄然消失——这是个问题Open weights are quietly closing up - and that's a problem

martinalderson.com·2026-05-06

文章警告，开源权重模型正逐渐减少，这将导致 AI 领域形成少数寡头垄断格局。作者指出，这些开放模型迫使前沿实验室保持合理定价，若消失则消费者剩余将被大企业攫取。现状显示，闭源模型主导市场，削弱了竞争与创新多样性。

Martin Alderson

在 LLM 领域，一直有一种普遍看法认为会出现某种程度上的竞争性开源模型。但我现在不确定这种假设是否仍然成立。

LLM 简史

在相对短暂的 LLM 发展史上，主要有两类模型——闭源和“开源权重”。几乎所有 OpenAI（尽管名字听起来是开放的！）的模型都是闭源的，而开源权重模型则来自其他研究机构。著名的 Llama 系列就是开源权重的代表，但最近中国的研究机构如 MiniMax、Z.ai、DeepSeek 和 Qwen（阿里云）推出的开源权重模型表现更胜一筹，Google 的 Gemma 系列以及 OpenAI 的 gpt-oss 模型通常稍逊一筹。

开源权重模型允许任何人在自己的硬件上运行该模型。通常来说，要运行这些有价值的模型需要非常强大的硬件，但这种情况正在迅速改变，越来越小的模型变得更具实用性。

能够本地运行这些模型（而不是通过 API 调用 OpenAI/Anthropic/Google 的服务）主要有三个优势。

首先，隐私和合规性。如果你拥有（非常）敏感的数据，很难甚至不可能将其通过 API 发送到前沿实验室的数据中心。能够在本地部署运行意味着数据永远不会离开你的网络环境。

其次，它提供了更大的灵活性。你可以将这些模型作为微调的基础，或者根据你具体的硬件需求对模型进行量化处理（简单来说就是压缩模型大小）。

最后，也是我这篇文章重点关注的方面——成本。它们通常比前沿模型便宜得多。显然，如果你在自己的硬件上运行，你只需要考虑硬件的资本支出、电力消耗和运维成本。但更重要的是，有数十家公司可以为你提供托管服务，通常每 token 的成本不到前沿模型的十分之一。

为什么开源权重模型如此重要

借用经济学中可竞争市场理论的一个概念：即使在垄断（或寡头垄断）市场中，只要存在廉价且可信的可替代选择，在位者往往会表现出竞争性行为。这个类比并不完美——该理论严格假设沉没成本接近于零，而这与训练前沿模型的现实恰恰相反——但其背后的机制是成立的。威胁是潜在的；消费者转换选择的权利才是约束定价的关键。

简而言之，我认为开源权重模型对前沿实验室构成了显著的下行价格压力。这并非绝对——显然人们愿意为更高质量的模型和与万亿美元级别公司签订推理合同所带来的保障支付更多费用，比如相比通过 OpenRouter 等低价推理提供商。OpenAI 等公司确实提供 SLA 和法律约束性的保密承诺。

但在我看来，这种下行压力足够大，以至于原本可能出现的寡头垄断市场行为很难显现出来。如果前沿实验室突然将价格提高五倍（当然纯属巧合），大量用户会转向开源权重模型，尤其是在对性能要求不高的应用场景中。

从价格行为的角度来看，我认为可以把开源权重模型类比为通用药品。一旦它们出现，大型制药公司就会大幅降价以更接近通用药的价格，并将精力集中在那些比通用治疗领先一步的新疗法上，从而维持高价。

如果没有开放权重，前沿实验室的定价能力将远超当前水平。

许可模式正在发生变化。

不过，开放权重模型的可用性并非理所当然。它们的训练成本高昂，背后的公司虽是商业实体——或许还受到中国政府的巨额补贴（甚至高度补贴）——但它们绝非慈善机构。

事实上，我们已观察到这些模型许可条件的显著收紧。Meta 目前完全停止了其最新“Muse Spark”模型的开放权重发布，甚至不再公开提供该模型。

阿里巴巴则越来越多地优先（或在某些版本中仅通过）其 API 发布模型。Kimi 的 K2.6 许可证新增了一项署名要求：若月活跃用户超过 1 亿或月收入达每月 2000 万美元，则必须在产品界面中显著标注“Kimi K2.6”。法国 Mistral 也对商业使用施加了差异化的许可条件。

当然也有例外——DeepSeek 实际上变得更加宽松，但总体趋势显然是许可条件趋于严格（Meta 和阿里巴巴均已停止部分或全部模型的开放发布）。

接下来会发生什么？

若干年后，我们可能面临一种（目前尚属假设性的）局面：大多数或所有此前开放的优质模型将不再被公开。尽管它们之间仍可能存在价格竞争，但如果训练这些模型的成本和复杂性持续上升，那么可以合理推断，最终市场将集中在少数几家公司手中——即西方三大前沿实验室与若干中国实验室，或可能出现中国政府主导下合并为一两家“超级实验室”的局面。此类战略性行业的整合早有先例——中国在轨道交通（CRRC）、核能、航空和电信领域正是这样做的，西方也非免疫于此——例如冷战后的国防承包商整合便是明证。

这一前景令人深感忧虑。AI 创造了巨大的消费者剩余——我通过 AI 获得的收益远超支付 token 的成本，今天的价格若翻十倍我也毫不犹豫地愿意买单；而在高价值专业或代理型工作中，我愿意支付与实际支付之间的差距更为巨大。这个差额正是一个缺乏开放权重基础的寡头有能力攫取的巨大红利。

在此情境下，经济理论预示权力与经济财富将向少数公司集中——实验室将直接将其转化为利润，榨取消费者剩余。而一旦形成少数几家企业构成的寡头格局，加之进入壁垒极高（新模型所需的重资本支出），价格竞争很可能极为有限。

同样，这种反乌托邦图景或许并不必然发生。随着硬件性能持续提升，训练一个“足够好”的模型或许会变得越来越容易。尽管 AI 硬件制造商寥寥无几，但我们看到的是激烈的硬件竞争。蒸馏技术（用前沿模型的输出来训练更小模型）有时被视为释放压力的阀门，但它仍依赖于首先能访问强大的基础模型——而这恰恰是当前最脆弱的一环。

一个充满活力的开放权重生态系统，长期以来一直是 AI 经济赖以运转的隐形支柱。值得警惕的是，这一基础正在瓦解，其对整体经济的深远影响不容小觑。

从技术上讲，有三种情况——“开放权重模型”仅发布最终的“模型”。另一类被称为“完全开放”或“可复现”，它不仅包含所有训练数据和相关的训练过程文档，这与我们所知的软件开源最为相似。

OpenRouter 提供了一种“API 的 API”，它会将你的请求路由到特定模型最便宜和/或最可用的推理提供商。这极大地提高了可靠性，因为如果一个提供商出现问题，它会立即切换到另一个提供商。同样地，如果有更便宜的提供商可用，它也会切换过去——这简直就是米尔顿·弗里德曼的梦想。

需要完整排版与评论请前往来源站点阅读。