AI 启示录的四位骑士Four Horsemen of the AIpocalypse
文章分析了推动 AI 发展的四大核心力量——算力、数据、算法和资本,将其比喻为‘四位骑士’,共同驱动技术狂潮。作者指出这些因素相互强化,形成难以打破的正反馈循环。该文属于付费通讯内容,深度剖析 NVIDIA、Anthropic 和 OpenAI 等行业巨头。
Ed Zitron
如果你喜欢这篇文章,欢迎订阅我的付费通讯。年费70美元,或月付7美元,你将获得一份每周更新的通讯,通常长达5000至18000字,内容包括对NVIDIA、Anthropic和OpenAI财务状况的详细分析,以及关于AI泡沫的深入探讨。我最近发布了《反潮流者指南:SaaS大崩盘》(Hater’s Guide To The SaaSpocalypse),还有《AI为何不会倒闭》(How AI Isn't Too Big To Fail),以及长达17500字的《反潮流者指南:OpenAI深度剖析》,就在上周,又推出了重磅之作——《反潮流者指南:私募信贷全景》。
订阅付费内容不仅物超所值,也让我能够持续撰写这些篇幅庞大、研究深入的免费文章。
配乐 — Megadeth — Hangar 18(降半音调)
近四年来,我一直致力于撰写关于AI泡沫和科技行业的长篇巨制。我依然打算继续写下去,但今天,我要做我最擅长的事——剖析科技行业中那些奇怪的现象,并解释它们为何令我深感忧虑。
而且,既然我喜欢讲这些精彩的故事,我会将它们与我对AI末日即将到来的预警信号联系起来——这些迹象表明,历史上最令人恼火的泡沫正开始破裂。
总之,考虑到现在通讯和播客已成为我的主要收入来源,我将在免费和付费内容中尝试不同的形式,以保持内容的趣味性和多样性。
Anthropic的产品频繁崩溃,因为它缺乏足够的算力,而Opus 4.7模型不仅性能更差,还消耗更多token。
预警信号:如果Anthropic和OpenAI进一步提高价格或降低服务质量,这将是他们现金流紧张的明确信号。
让我们从一个直接的判断开始:Anthropic应该停止接受新客户,直到它解决其容量问题。
一般来说,任何你经常使用的服务——比如Netflix——都应具备“四个九”的可用性标准,即正常运行时间达到99.99%。一旦公司发展到一定规模,拥有四个九的可用性被视为标准的商业实践……
……除非你是Anthropic!
截至本文撰写时,Claude聊天机器人的可用率为98.79%,平台/控制台为99.14%,API为99.09%,Claude Code为99.25%(过去90天数据)。
让我来帮你理解这个差距。当服务达到99.99%的可用性时,每周仅会中断一分钟(0.48秒)。而像Claude聊天机器人这样只有98.79%的可用性,每周中断时间将高达两小时一分五十八秒。
换句话说,98.79%的可用性意味着在一年中,服务将有近四天处于不可用状态。
更令人震惊的是,Claude for Government的可用性仅为99.91%。政府服务通常至少要求达到四个九的标准,而对于涉及紧急服务等关键系统,则要求更高,达到五个九(99.999%)。
这是一家最近融资300亿美元、备受瞩目的公司,却被视为天才般的存在,然而其服务却频繁出现可用性问题,根源在于算力不足。
据《华尔街日报》报道:
自二月中旬以来,Anthropic各系统的故障频发,一些企业客户已开始转向其他AI模型提供商。
Retool软件开发平台创始人兼首席执行官David Hsu表示,他更倾向于使用Anthropic的Opus 4.6模型来驱动其公司的AI代理工具,因为他认为这是最适合企业级应用的模型。不过该公司最近已将AI代理切换至OpenAI的模型。“Anthropic的服务一直频繁宕机,”他说道。互联网核心服务的可靠性通常以“九个9”来衡量——四个9即99.99%的正常运行时间,这是软件公司向客户承诺的典型标准。截至4月8日,Anthropic的Claude API在过去90天内的正常运行时间仅为98.95%。
然而Anthropic的问题远不止简单的宕机(正如我上周所讨论的),还导致Opus 4.6出现严重性能问题(无论是有意还是无意):
最详尽的公开投诉始于Stella Laurenzo于2026年4月2日在GitHub上提交的一个issue。她的领英资料显示她是AMD人工智能组的资深总监。她在帖子中写道,Claude Code已退化到无法信赖复杂工程工作的程度,并辅以对6,852个Claude Code会话文件、17,871个思考块和234,760次工具调用的广泛分析来佐证这一说法。该投诉指出,自2月起,Claude的推理深度估算值急剧下降,同时伴随性能恶化的迹象明显增加,包括更早停止推理、更多“最简单修复”行为、更多循环推理,以及从研究优先转向编辑优先的行为模式转变。
尽管Anthropic声称不会为了应对需求而降低模型性能,但这与众多用户抱怨的问题并不相符。Anthropic的回应基本是否认存在问题,其发言人仅将VentureBeat记者Carl Franzen(他在此事上有篇精彩报道)引向两条不同的推特帖子,而这两条内容均未真正解释实际情况。
情况在Opus 4.7发布后进一步恶化,该版本似乎表现更差且消耗更多token。
据《商业内幕》报道:
一个标题为“Claude Opus 4.7是严重倒退而非升级”的Reddit帖子已获得2,300个赞。一位X用户的评论称Opus 4.7相比Opus 4.6并未真正改进,获得14,000个点赞。在一项非正式但流行的AI智能测试中,Opus 4.7竟表示“strawberry”中有两个P字母。另一位用户贴出的截图显示它声称因“偷懒”而未进行交叉引用。一些Reddit用户发现Opus 4.7会重写他们的简历,虚构新的学校和姓氏。多位X用户推测Opus 4.7可能变笨了。部分X用户认为问题根源在于AI模型的推理时间设置。Anthropic表示新的“自适应推理”功能让模型能自主决定思考时长。一位用户写道自己“无法让Opus 4.7进入深度思考状态”,另一位则称其“削弱了性能表现”。对此,Claude Code创作者Boris Cherny回应称:“不准确。自适应思考让模型自主选择何时思考,实际上表现更好。”
一家据称价值数千亿美元的公司竟然无法保证其服务持续稳定运行,反而似乎让产品变得更差,还拒绝正视或讨论这个问题,这实在令人深感荒谬。自2024年起,用户就一直在抱怨Claude模型“越来越笨”,而每次面对的都是来自这家公司的敷衍回应——其CEO热衷于谈论他的AI产品将取代一半的白领工作,却对问题避而不谈。
Anthropic在应对容量问题上毫无良策,不应再接受新客户——增加容量只会让它亏得更多。
有人可能会说Anthropic对其产品有“永不满足的需求”,但在我看来,这是一家基础设施糟糕透顶、运营方式不道德的烂生意。显而易见且令人担忧的是,Anthropic根本无力为客户提供稳定可靠的服务。它计划扩大容量的举措包括与Broadcom签订协议(预计2027年才上线),以及与Hut8合作(后者似乎从未建造过AI数据中心)和CoreWeave(该公司尚未完成与OpenAI的2025年协议所需的全套产能建设,截至2025年底仅拥有约850兆瓦的“可用电力容量”,即实际算力约为653兆瓦,相比2024年底的360兆瓦有所增长)。
请记住:数据中心建设耗时极长,全球可用容量有限,而其中大部分已被微软、谷歌、亚马逊、Meta和OpenAI占据,而这三家巨头早已同时为Anthropic和OpenAI提供算力支持。
我们可能已经触及了可用AI算力的绝对物理极限,即便未来有其他数据中心建成,难道计划是永远把这些资源交给OpenAI或Anthropic吗?
此外,新增算力的目标也尚不明确,正如我上周所讨论的那样:
然而,“更多算力”究竟意味着成本更低、体验更好,还是仅仅让Anthropic能够以不断恶化的服务质量来扩张规模,这一点仍不清楚。需要说明的是,当像Anthropic或OpenAI这样的AI实验室“达到容量上限”时,并非指它们停止接单或取消订阅,而是现有及新订阅用户将面临随机宕机、模型性能下降以及日益严苛的速率限制。这两家公司并未因无法提供服务而陷入财务困境(相反,正是因为他们向客户提供服务才导致亏损),真正为此买单的只有用户。
那么,真正的目标是什么?是改善现有用户的体验?还是确保有足够算力继续吸纳新用户?抑或是支撑像Mythos这样的大型模型?Anthropic到底何时才能达到平衡状态,又该是什么样子?
还有一个成本问题。
Anthropic每年亏损数十亿美元,却仍在提供可用性业余、质量波动的服务,并持续接纳新订阅者,这意味着容量问题并未影响其增长势头。因此,增加算力只会以更昂贵的代价让产品变得稍微好一点。
Anthropic的增长故事建立在补贴和劣质服务的基础之上,纯属骗局。
Anthropic的增长故事建立在一种虚假的基础上:通过销售订阅服务,让用户每投入1美元订阅费,就要额外支付8到13.5美元的运营成本,同时提供一种脆弱且不一致的服务——而这只有在近乎无限的创投资金和基础设施供应商承担数据中心建设费用的情况下才可能实现。
换句话说,Anthropic不必遵守常规规则。风投资金让它能够大规模补贴其服务,而媒体无休止的吹捧则掩盖了服务质量持续下滑的事实。科技领域,尤其是AI领域缺乏有效监管,使得该公司可以随心所欲地调整速率限制,对顾客进行变相“rugpull”(突然撤资或欺诈行为)。
如果Anthropic被迫按实际成本收费——没错,我不相信它的API是盈利的,无论多少人误读Dario Amodei的采访——那么随着客户直面AI的真实成本(我稍后会详述),其增长将迅速崩溃。如果Anthropic必须提供稳定服务,就不得不停止接纳新客户,或者大幅推高推理成本。
Anthropic是一场骗局,而这个骗局之所以能持续,全靠没完没了、站不住脚的炒作。盲目追捧这家公司一切作为的人,都是受害者。
Claude Mythos并未因能力担忧被推迟发布,而是受限于算力瓶颈。
恭喜所有再次中招的“年度再信奖”得主。据《金融时报》报道:
Anthropic表示,在确认模型安全且不会被恶意利用之前,将暂缓更大范围的发布。该公司算力有限,近期还遭遇了多次宕机。知情人士透露,Anthropic推迟全面上线是为了确保能稳定地向客户提供该模型服务。
所以,没错,任何媒体只要轻信Dario Amodei那句“太危险不能发布”的鬼话,都是受害者。Cal Newport有一篇出色的文章戳破了这场 hype,但我的总体感觉是:如果Mythos真那么强大,Claude Code的源代码是怎么泄露的?
Anthropic难道就没用他们超级强大的Mythos模型检查一下?还是说根本没发现任何问题?不管哪种情况,对所有人来说都相当尴尬。
AI算力需求被Anthropic和OpenAI人为夸大,超过50%正在建设的AI数据中心专为这两家公司建造,而到2028年底仅有15.2GW的新增产能处于建设阶段。
白马:数据中心项目烂尾及其他乱象。
如我之前所述,目前全球仅有5GW的AI算力设施处于建设阶段(基于Sightline Climate的研究数据),这里的“建设中”包括从工地搭起围栏(如Nscale位于卢顿的数据中心)到即将交付客户的建筑等各种情况。
我联系了Sightline以核实细节,他们告诉我:到2028年底计划投产的总容量为114GW,但其中仅有15.2GW处于实际建设阶段,其中包括2026年计划投入的5GW。
这……非常糟糕。
更糟的是,这些建设项目中的大部分都指向两家公司:
补充一点:Anthropic已同意在未来十年内向亚马逊云服务(AWS)投入1000亿美元,作为其与亚马逊价值50亿美元(未来可能追加至200亿美元,且无更多披露细节)投资协议的一部分。据称,Anthropic将获得5吉瓦的算力支持,并于今年年底前上线“近1吉瓦的Trainium 2和3芯片算力”。对此我持怀疑态度,但暂且不表。这些交易在法律上本不应被允许。
综上所述,在建的15.2吉瓦数据中心容量中,至少有4.6吉瓦专供OpenAI使用,另有至少4吉瓦通过微软、谷歌和亚马逊等合作伙伴预留给Anthropic。实际上,这一数字可能远高于此。
这种情况从根本上说是荒谬至极。OpenAI和Anthropic每年消耗数十亿美元,据《信息报》报道,Anthropic预计2026年将烧掉至少110亿美元,OpenAI则高达250亿美元。这两家公司若要持续生存,唯一的出路只能是不断融资——要么靠无限轮次的风险投资,要么等到IPO后通过无限发行债务或市场配售股票来维持。
NVIDIA宣称其2027年前的销售额可达1万亿美元,但实际在建的数据中心仅值2850亿美元规模的GPU——NVIDIA正提前数年预售GPU并将其囤积在仓库中。
更令人担忧的是,宣布的算力容量中仅有极小一部分正在建设中,尤其是当你将其与NVIDIA的实际销售数据对比时,这种差距显得尤为突出。
去年,TD Cowen的杰罗姆·达林估计,每兆瓦关键IT设备(包括GPU、服务器、存储等)的成本约为3000万美元,而建造一个数据中心每兆瓦的成本为1200万至1400万美元,这使得关键IT成本占到了总成本的约68%(在建设成本较高的一端)。
现在需要明确的是,这些关于数据中心的吉瓦和兆瓦数字指的是电力容量,而非关键IT设备本身;如果我们取平均PUE(电源使用效率,衡量数据中心电力使用效率的指标)为1.35,那么关键IT硬件总量将达到11.2吉瓦,其中我估计90%是GPU,因此GPU的总量约为10.1吉瓦。
如果我们将这10.1吉瓦的GPU按每机架功耗约140千瓦的GB200或GB300 NVL72规格划分,则相当于约71,429个机架的硬件规模,每个机架平均价值400万美元,这意味着NVIDIA将实现约2857亿美元的收入。
NVIDIA声称其在2025年至2026年间累计订单达5000亿美元,到2027年销售额有望突破1万亿美元,但除了位于台湾的一个仓库之外,尚不清楚这些订单究竟要运往何处。
至此,人们不禁要问:既然无处安放,为何还要疯狂采购更多GPU?如今每一次NVIDIA的财报超预期都显得愈发可疑。
AI确实非常昂贵,企业甚至可能在未来几个季度内将LLM代币支出高达员工人力成本的100%
新白马骑士:任何表明公司正面临AI经济现实迹象,包括对日益增长的AI成本提出抱怨或采取相应调整措施。
上周,高盛的一份报告指出(引用原文):“……企业在推理方面的初始预算严重超支(我们听说某行业数据显示工程领域的推理成本现已接近员工人力成本的10%,且根据当前趋势,未来几个季度可能会与人力成本持平)。”
简而言之,这意味着一些公司正在花费高达其员工人力成本10%的资金用于生成式AI服务,却并未带来稳定性、质量或效率上的提升——更不用说(虽然我不希望如此)裁员理由了。
《信息报》的劳拉·布拉顿上周也报道,优步(Uber)在2026年初仅几个月就耗尽了全年AI预算:
据首席技术官普拉文·内帕利·纳加透露,优步激增的AI编码工具使用量,尤其是Anthropic公司的Claude Code,使其在2026年仅几个月就用完了全年的AI预算。“我已经回到原点,因为我原本以为需要的预算已经被彻底打乱了,”纳加在接受采访时表示……他拒绝透露公司软件预算的具体数额以及其在AI编码工具上的具体支出。优步的研发费用从上一年的31亿美元增至2025年的34亿美元,涨幅达9%,该公司在最近一份证券备案文件中称,预计这一成本将继续以绝对数值形式上升。
优步的首席技术官还补充说,其后台系统中约“11%的真实代码更新由AI代理编写,这些代理主要基于Claude Code构建,而三个月前这一比例仅为百分之几。”任何在过去一年使用过优步应用的人都能看到这进展得如何,尤其是当他们不得不提交任何类型的支持工单时。
说真的,我觉得这一切他妈的完全疯了。生成式AI的销售说辞是它将成为一种神奇的、提升效率的万能药,但每当你问别人时,答案要么是“是啊,我们用AI写所有代码!”却没有任何具体好处,要么就是“这玩意儿花他妈太多钱了。”
让我们实际点,用Spotify举个例子,因为它的CEO自豪地说,其“顶尖工程师”几乎不再写代码了——不过要说明的是,高盛的那个例子并没有特指哪家公司。
为了论证,假设这家公司拥有3000名工程师——某个网站声称有2700人,但我见过高达3500人的报告。再根据Spotify Blind(一个面向科技从业者的匿名社交媒体平台)的数据,我们假设这些工程师的年薪中位数为19.2万美元。
如果Spotify将其工程人力成本的10%(约5.76亿美元)用于AI推理,那么它将花费大约5760万美元,约占其2025财年研发支出13.93亿美元的4.1%。台下的数学爱好者会注意到,若将全部人力投入用于AI推理,成本将接近研发预算的一半,或约为当年22亿美元净收入的1/4。
现在必须澄清的是,这些数字可能已经包含了一部分AI推理的开支,但我只是想说明这个成本的巨大规模。
这对Anthropic(以及程度较轻的OpenAI)来说当然不错,但我看不出它的客户能从中受益。软件工程的成本直接增加10%,恰恰与AI原本旨在降低成本的目标背道而驰;如果成本继续上涨,我不确定谁能进一步证明这笔开支的合理性。
而且我们很快就会知道结果,因为代币补贴的时代正在终结。
次贷AI危机持续发酵:微软将于今年晚些时候对GitHub Copilot实施基于代币的计费模式,而Anthropic也已开始将企业客户转向API费率体系。
白马:如果AI初创公司进一步提价或服务降级,没错,这就是我对GitHub Copilot的评价——它亏损数亿美元,却几乎不产生收入。
正如我昨天报道的那样,内部文件显示,微软计划暂时暂停个人账号注册其GitHub Copilot编程产品,全面收紧速率限制,从其每月10美元的Pro订阅中移除Opus模型,并于今年晚些时候从请求(与GitHub Copilot的单一交互)转向基于代币的计费模式——微软在博客中确认了其中部分细节(但不包括代币计费)。
这是一项重大举措,据我的调查,其背后原因是微软运行GitHub Copilot的周环比成本自1月份以来几乎翻了一番。
顺便解释一下:如果你对“基于令牌的计费”感到困惑,要知道目前绝大多数 AI 服务都在补贴其订阅费用,而是采用另一种计量方式(如“请求次数”或“速率限制”)来衡量用户使用服务的程度。然而,这些服务仍会以产生成本相同的速率消耗令牌——例如我之前提到的 Opus 4.7 每百万输入收费 5 美元、每百万输出收费 25 美元——这意味着除非用户几乎不使用订阅服务,否则公司几乎总是亏钱。企业这么做是为了扩大订阅用户规模,我认为他们曾以为成本最终会下降。大家干得真棒!
转向基于令牌的计费后,GitHub 用户将根据平台使用量以及提示词消耗的令牌数量被收费——也就是他们使用的计算资源多少。目前尚不清楚这一政策何时开始实施,但它显著改变了产品的价值。
我也要说,微软完全停止新付费 GitHub Copilot 订阅的做法是软件史上最具冲击力的举措之一。我从未见过哪家公司在非彻底放弃产品的情况下采取如此行动,而据我所知的原因——根据我的消息来源——是因为它计划将付费客户迁移到基于令牌的计费模式,尽管目前还不清楚这些层级具体如何划分,因为每月 10 美元和每月 39 美元的订阅主要区别在于可使用的请求次数。
值得注意的是,微软是少数能够长期持续资助 AI 的公司之一,自 2023 年中以来每季度利润超过 200 亿美元。
它决定削减 AI 相关开支,表明这些成本已变得难以承受。《信息报》今年一月份报道,仅与 Anthropic 的合作就使微软每年支出达 5 亿美元,如果这一数字翻倍,很可能意味着微软在 GitHub Copilot 上的投入是其收入的十倍。据我今日披露,截至 2025 年底,GitHub Copilot 收入约为 10.8 亿美元,其中大部分来自 CoPilot Business 和企业版订阅。
《信息报》几周前还报道称,GitHub 近期频繁出现宕机,原因包括“流量激增”以及“将其应用从自有服务器迁移至微软 Azure 云”的努力。
GitHub COO 凯尔·戴格尔表示:“自一月以来,几乎每个月每周都会创下新的峰值记录。”他将增长归因于“代理和人类用户”,并指出 AI 编程工具的兴起促使越来越多缺乏深厚编码知识的人类也开始更多地使用 GitHub 平台。
这里的“代理”可能指代任何事物——OpenAI 的 Codex、Anthropic 的 Claude Code,甚至有人将效率低下且实用性存疑的 OpenClaw 接入 GitHub Copilot 账户。如果是这种情况,那么转向基于令牌的计费和速率限制很可能是背后的推动力。
无论如何,如果微软做出这一决策,说明 CFO 艾米·胡德——去年主导数据中心建设放缓的关键人物——已经认定补贴时代结束了。尽管微软尚未正式宣布转向基于令牌的计费,但我猜测本周就会公布这一消息。
两周前,Anthropic 对其企业客户采取了相同的定价策略,将费用统一调整为每人每月20美元,并在此基础上按他们使用的模型按 token 计费。
我判断,到2026年底,大多数 AI 服务将把部分或全部客户转向基于 token 的计费模式,因为他们正在核算运行 AI 模型的真正成本。
这就是 AI 狂热时代
我今天说得简单一些,既是为了让自己轻松一点,也是因为我觉得这些故事确实值得讲出来。
不过,我还是忍不住想吐槽一下,现在的一切都变得多么荒谬。
无论你走到哪里,总有人谈论“智能体”(agents),但他们的理解与现实完全脱节。比如 Aaron Levie 那些长篇大论的言论——他说“AI 智能体让全球每家公司都开始为自动化工作流程开发软件,这在技术上不可行,在经济上也不划算”——这话听起来就像在说独角兽和蝎尾兽,跟现实毫无关联。
我对批评 Aaron 感到有点愧疚,因为他看起来并不是坏人。然而,他越来越典型地代表了高管层那种疯狂的 AI 狂热,整个行业讨论问题的方式只剩下模糊的未来感词汇,比如“智能体”、“推理”和“token 作为商品”,目的只是为了掩盖一个丑陋而简单的真相:生成式 AI 利润微薄,甚至亏损,似乎既没有带来实际的生产力提升,反而还在不断赔钱。
尽管我的论点可能有些冗长,但归根结底其实很简单:AI 并没有带来哪怕一丁点值得其高昂代价的经济或其他方面的好处。每一条关于降本增效或惊人烧钱速度的新闻都在不断印证我的观点,而支持者们通常只会回应一句:“看啊,收入多高!”
可事实并非如此!AI 的收入简直烂透了,糟糕透顶,可怜至极。整个行业——包括 OpenAI 和 Anthropic 理论上高达131亿美元和45亿美元的营收——去年总收入也就约650亿美元,这其中还包含了像 CoreWeave 这样的云服务商和微软等超大规模云厂商提供的算力收入。
我干脆直说了吧:我认为 AI 初创公司正在误导投资者和普通大众,夸大自己的营收。根据我去年报道的数据,OpenAI 在2025年前三季度的营收约为43亿美元;而 Anthropic 的首席财务官克里希纳·拉奥在一份宣誓书中称,截至2026年3月9日,该公司营收“超过”(唉)50亿美元,这个数字怎么加都显得不合理。
Cursor 据称年营收已达60亿美元(约合每月5亿美元),并且“毛利率为正”——鉴于它去年不得不融资逾30亿美元,今年又似乎在筹备新一轮20亿美元融资,我对这一点也表示怀疑。
即便这些数字属实,OpenAI、Cursor 和 Anthropic 的大部分收入仍来自补贴性质的订阅服务。形势已经严峻到连 CNBC 的 Deidre Bosa 都同意我的看法:AI 需求被 token 最大化使用和补贴服务严重扭曲了。
否则,其他所有人都在赚个位数或两位数的百万美元,却在这个过程中损失了数亿美元。据创始人斯科特·史蒂文森(Scott Stevenson)称,虚报年化收入的情况极为普遍——AI初创公司会签订“三年期”企业协议,首年打折,外加12个月的退出选项:
许多AI初创公司之所以能打破营收纪录,是因为它们采用了一种不诚实的指标。全球最大的基金都在支持这种做法,并误导记者以获得公关报道。具体操作是:公司与客户签署3年期企业协议,第一年价格较低(比如100万美元),第二年上涨至200万美元,第三年按全价300万美元收费。但他们将300万美元作为“年度经常性收入”(ARR)对外公布——尽管目前实际只收到100万美元。最糟糕的是,客户在12个月后拥有无条件解约权!这根本不是真正的三年期合同。
虽然很难确定这种潜在的欺诈行为有多普遍,但史蒂文森估计,超过50%的AI企业级初创公司都在使用“签约ARR”来抬高估值。一位(诚实的)创始人回应史蒂文森时表示,他的公司签约ARR为35万美元,但实际ARR仅为4.2万美元,他还补充说:“明年应该会很棒吧”——但我认为对于一个看起来只是用来寻找投资人的聊天机器人来说,恐怕未必如此。
这个行业的未来完全建立在无限资源存在的基础上,而大多数AI公司实际上只是Anthropic和OpenAI所拥有的模型的前端界面,这两家公司依赖无限资源来运行其服务并支撑基础设施。
而在整个链条顶端的是英伟达(NVIDIA),它是股市上最大的公司,正在销售远超实际可安装数量的GPU,却似乎很少有人注意到或在意这一点。
我说的可不是几十亿、上百亿美元的GPU堆积在仓库里无人安装——单是安装一个季度销售的GPU就需要六个月时间。根据我所读过的所有财经媒体的报道,普遍假设似乎是:“它会永远卖GPU,而且一切都会变得无比美好。”
杰森,你到底要把它们放哪儿?这些该死的GPU要去哪里?根本没有足够的建设容量!如果英伟达真的像宣称的那样卖出那么多GPU,那它很可能在“所有权转移”上做文章——把尚未真正交付给买家的产品标记为“已售出”。
备注:已经有迹象表明GPU开始积压了。你要知道,当超大规模云服务商购买AI服务器时,实际情况是:原始设计制造商(ODM)从英伟达采购GPU,组装成服务器后再运往数据中心——这一切都是合规且正常的流程。这些ODM公司会将英伟达GPU的全部价值计入营收,这也是为什么富士康、纬创(Wystron)和广达电脑(Quanta Computing)等公司的营收在AI泡沫期间大幅飙升的原因。哦对了,那些迹象。根据广达电脑第四季度的财务报告显示,库存(也就是等待出货的东西)从2025年第三季度的105.4亿美元飙升至2025年的163亿美元,同比增长近一倍(83.3亿美元),而毛利率则从2024年第四季度的7.9%下滑至2025年同期的7%。虽然这不是普遍问题(例如纬创的库存环比下降),但台湾地区的ODM厂商很可能是最先出现库存累积的地方之一。
无论如何,我反复提及“歇斯底里”这个词,因为很难找到其他词汇来形容这种炒作周期。媒体、市场、分析师、高管和风险投资家谈论人工智能的方式完全脱离现实——他们用与实际不符的术语讨论“智能体”,用完全荒谬的“吉瓦时”数据描述AI数据中心,并以一种令人不寒而栗的笃定口吻展开论述,这让我不禁怀疑自己是否遗漏了什么关键信息。
但所有迹象都表明我是对的,如果我的判断在宏观层面也成立,那么我认为我们正面临一场投资界和主流媒体的公信力危机——因为普通人敏锐地察觉到不对劲,而很多时候正是因为他们具备基本的计算能力。
需要完整排版与评论请前往来源站点阅读。