微软将把 GitHub Copilot 用户转向基于 Token 的计费模式并收紧速率限制Exclusive: Microsoft To Shift GitHub Copilot Users To Token-Based Billing, Tighten Rate Limits
微软计划暂停个人账号注册 GitHub Copilot,并过渡到基于 Token 的计费系统,取代原有的按请求次数计费模式。内部文件显示,自推出以来,GitHub Copilot 每周运行成本已翻倍。此举旨在优化资源使用并控制服务成本,同时可能影响用户的访问频率和支出结构。
Ed Zitron
执行摘要:
注:微软已在博客文章中确认了部分细节。
由 Where’s Your Ed At 获取的泄露内部文件显示,微软拟暂停 AI 编程产品 GitHub Copilot 的学生和付费个人套餐的新用户注册,收紧速率限制,并最终将用户迁移至“基于代币的计费”系统——即根据用户实际消耗的代币成本进行收费。
说明:目前,GitHub Copilot 用户拥有一定数量的“请求”——即向模型提出任务的行为。Pro(每月 10 美元)账户每月可获 300 次请求,Pro+(每月 39 美元)则可获得 1500 次。更高级的模型消耗更多请求,便宜的则用得更少(我稍后会解释)。转向“基于代币的计费”意味着用户将不再使用“请求”作为单位,而是按实际使用的代币成本付费。例如,Claude Opus 4.7 每百万输入代币收费 5 美元,每百万输出代币收费 25 美元(包括用于链式思考推理的代币)。
基于代币的计费
文件中指出,尽管基于代币的计费一直是微软的首要任务,但最近几个月变得尤为紧迫,因为自一月份以来,GitHub Copilot 每周的运行成本几乎翻了一番。
转向基于代币的计费后,GitHub 用户将根据其在平台上的使用情况以及提示所消耗的代币数量被收费——从而反映其计算资源的使用量。目前尚不清楚这一变更何时开始实施。
这是一项重大举措,反映出运行任何 AI 产品模型所需的高昂成本。与 Anthropic、OpenAI、Cursor 及其他所有 AI 公司一样,微软此前一直在补贴计算成本,让用户能够以远低于订阅费用的价格燃烧大量代币。
补贴型 AI 产品的时代似乎正在结束。微软即将采取的这一举措紧随 Anthropic(据 The Information 报道)近期对企业用户转向基于代币计费的调整之后,后者旨在降低自身成本。
暂停个人与学生套餐的新注册
GitHub Copilot 目前为个人开发者提供两个层级:每月 10 美元的 GitHub Copilot Pro 和每月 39 美元的 GitHub Copilot Pro+。
根据泄露的文件,这两个个人套餐以及包含在免费 GitHub Education 包中的 GitHub Copilot Student 产品均将受到此次关停的影响。
移除 Opus 模型并收紧 Pro、Pro+、商业版与企业版的速率限制
文件显示,微软还计划进一步收紧 Copilot 商业版和企业版计划的速率限制,同时也会对个人账户的速率限制进行压缩——这些限制已被逐步收紧——并暂停付费个人套餐的试用,以“打击滥用行为”。
尽管微软一直在调整 GitHub Copilot 个人账户的速率限制,最近一次是在四月初,但文档指出这些改动仍不够,未来几周内还将推出更多速率限制调整。
作为此次成本削减计划的一部分,微软计划完全从每月 10 美元的 GitHub Copilot Pro 套餐中移除 Anthropic 的 Opus 系列 AI 模型。
微软最近于四月初为 GitHub Copilot Pro+ 用户停用了 Opus 4.6 Fast 模型,尽管这一决定被描述为“进一步提升服务可靠性”并“精简我们的模型产品线,集中资源支持用户使用最频繁的模型”。
其他 Opus 模型——即 Opus 4.6 和 Opus 4.5——将在未来几周内从 GitHub Copilot Pro+ 层级中移除,届时微软将全面转向 Anthropic 最新的 Opus 4.7 模型。
向 Opus 4.7 的迁移很可能导致 GitHub Copilot Pro+ 用户更快达到使用上限。
微软在 4 月 30 日前提供 7.5 倍请求乘数,但不确定之后该乘数是否会变化。这听起来像是利好,但实际上意味着每次调用 Opus 4.7 的请求相当于 7.5 次标准请求。Reddit 用户迅速算出这一点,并对此表示担忧。
高级请求乘数允许 GitHub 反映不同模型的计算成本。需要最多计算资源的 LLM 将获得更高的高级请求乘数,相比之下,轻量级模型则较低。
例如,GPT-5.4 Mini 模型的高级请求乘数为 0.33——即每条提示被视为三分之一的高级请求;而现已退役的 Claude Opus 4.6 Fast 的乘数为 30 倍,意味着每次请求被视为三十次。
Claude Opus 4.6 的标准版本高级请求乘数为 3——这意味着即使有促销价格,Claude Opus 4.7 的使用成本仍高出约 250%。
所有这些变更的公告将在本周陆续发布。
如果你喜欢这条新闻,并希望支持我的独立报道与分析,不妨订阅我的付费通讯。
年费 70 美元或月付 7 美元,你将收到一份每周更新的通讯,通常长达 5,000 至 18,000 字,内容包括对 NVIDIA、Anthropic 和 OpenAI 财务状况的详细分析,以及关于 AI 泡沫的整体深度剖析。我最近发布了《反潮流者指南:SaaS 大崩溃》(Hater’s Guide To The SaaSpocalypse)、《AI 为何不会轻易失败》(How AI Isn't Too Big To Fail)、《OpenAI 反潮流者深度指南》(长达 17,500 字)以及上周刚推出的《私人信贷反潮流者指南》。
订阅付费内容不仅物有所值,也让我能够持续撰写这些每周发布的、篇幅庞大且研究深入的免费文章。
需要完整排版与评论请前往来源站点阅读。