返回 2026-04-20
🛠 工具 / 开源

独家:微软拟将 GitHub Copilot 用户转向按 Token 计费,并收紧速率限制Exclusive: Microsoft To Shift GitHub Copilot Users To Token-Based Billing, Tighten Rate Limits

wheresyoured.at·2026-04-20

微软计划暂停 GitHub Copilot 个人账户注册,推动从按请求计费向基于 Token 的计费模式过渡。内部文件显示,GitHub Copilot 的周运营成本自推出以来已翻倍。此举旨在优化资源分配并控制不断攀升的 AI 推理开销。新计费模型将更精确反映用户实际消耗的模型计算量。

Edward Zitron

执行摘要:

  • 内部文件显示,微软计划暂时暂停其 GitHub Copilot 编程产品的个人账户注册,因其正从“请求”(与 Copilot 的单一交互)计费模式转向基于 token 的计费方式。
  • 文件显示,自今年年初以来,运行 GitHub Copilot 的周成本已翻倍。
  • 微软还打算收紧其个人和企业账户的速率限制,并取消最便宜订阅用户的某些模型访问权限。
  • 注:微软现已在一篇博客文章中确认了部分细节。

    据 Where’s Your Ed At 查阅的泄露内部文件显示,微软计划暂停 AI 编程产品 GitHub Copilot 的学生版和个人付费版的注册,收紧速率限制,并最终将用户迁移至“基于 token 的计费”模式,根据用户实际消耗的 token 成本进行收费。

    说明:目前,GitHub Copilot 用户拥有一定数量的“请求”——即你要求模型执行某项操作的交互。Pro 版(每月 10 美元)账户每月可获得 300 次请求,Pro+ 版(每月 39 美元)可获得 1500 次。更昂贵的模型消耗更多请求,较便宜的则消耗较少(稍后详述)。转向“基于 token 的计费”意味着,GitHub Copilot 用户将不再按“请求”计费,而是按实际消耗的 token 成本付费。例如,Claude Opus 4.7 的输入 token(你输入的内容)每百万个收费 5 美元,输出 token(模型生成的内容,包括链式思维推理的 token)每百万个收费 25 美元。

    基于 token 的计费

    文件称,尽管基于 token 的计费一直是微软的首要任务,但近几个月来该需求变得更加紧迫,自 1 月以来,运行 GitHub Copilot 的周环比成本几乎翻了一番。

    转向基于 token 的计费后,GitHub 用户将根据其平台使用情况以及提示所消耗的 token 数量(即其使用的计算资源量)被收费。目前尚不清楚这一变更何时开始实施。

    这是一项重大举措,反映出运行任何 AI 产品模型的显著成本。与 Anthropic、OpenAI、Cursor 及其他所有 AI 公司一样,微软一直在补贴计算成本,允许用户消耗的 token 远超其订阅费用。

    补贴型 AI 产品的盛宴似乎即将结束。继 Anthropic(据 The Information 报道)近期将企业用户转向基于 token 计费以降低成本之后,微软也即将采取类似行动。

    暂停个人版和学生版的注册

    目前,GitHub Copilot 为个人开发者提供两个版本:每月 10 美元的 GitHub Copilot Pro,以及每月 39 美元的 GitHub Copilot Pro+。

    根据泄露的文件,这两个版本都将受到此次关停影响,包含在免费 GitHub Education 套餐中的 GitHub Copilot 学生版也将受到影响。

    从 GitHub Copilot Pro 中移除 Opus,收紧 GitHub Copilot Pro、Pro+、Business 和 Enterprise 的速率限制

    文件称,微软还打算收紧部分 Copilot Business 和 Enterprise 计划的速率限制,以及个人计划的限制(这些限制此前已被压缩),并暂停付费个人计划的试用,以“打击滥用行为”。

    尽管微软定期调整个人 GitHub Copilot 账户的速率限制,最近一次是在四月初,但文件指出这些变更力度不足,未来几周还将推出更多速率限制调整。

    作为这项成本削减措施的一部分,微软计划彻底从每月 10 美元的 GitHub Copilot Pro 套餐中移除 Anthropic 的 Opus 系列 AI 模型。

    微软最近于四月初为 GitHub Copilot Pro+ 用户停用了 Opus 4.6 Fast,尽管这一决定被表述为“进一步提升服务可靠性”以及“精简我们的模型组合,并将资源集中于用户最常使用的模型”。

    其他 Opus 模型——即 Opus 4.6 和 Opus 4.5——将在未来几周内从 GitHub Copilot Pro+ 层级中移除,因为微软正逐步过渡到 Anthropic 最新的 Opus 4.7 模型。

    转向 Opus 4.7 后,GitHub Copilot Pro+ 用户可能会更快达到使用上限。

    微软提供截至 4 月 30 日的 7.5 倍请求乘数优惠——尽管该日期之后的乘数尚不清楚。这听起来似乎是好事,但实际上意味着每次使用 Opus 4.7 的请求相当于 7.5 次请求。Reddit 用户迅速意识到这一点,并对此略感担忧。

    高级请求乘数使 GitHub 能够反映不同模型的计算成本。相比更轻量级的模型,那些需要最多计算资源的 LLM 将具有更高的高级请求乘数。

    例如,GPT-5.4 Mini 模型的高级请求乘数为 0.33——意味着每个提示仅被视为三分之一次高级请求——而现已停用的 Claude Opus 4.6 Fast 则拥有 30 倍乘数,即每次请求被视为三十次请求。

    标准版 Claude Opus 4.6 的高级请求乘数为三——这意味着即使享受促销定价,使用 Claude Opus 4.7 的成本仍高出约 250%。

    所有这些变更的公告将在本周陆续发布。

    如果你喜欢这则新闻并希望支持我的独立报道与分析,不妨订阅我的付费通讯。

    年费 70 美元,或月付 7 美元,作为回报,你将每周收到一篇通常为 5,000 至 18,000 字的通讯,内容涵盖对 NVIDIA、Anthropic 和 OpenAI 财务状况的详尽分析,以及对整个 AI 泡沫的深入探讨。我最近发布了时效性强且重要的《SaaS 末日之厌恶者指南》,另一篇《AI 并非大到不能倒》,一篇深度(17,500 字)的《OpenAI 厌恶者指南》,以及上周刚推出的重磅《私募信贷厌恶者指南》。

    订阅付费版本不仅性价比极高,也使我能够每周撰写这些篇幅庞大、研究深入的自由文章。

    需要完整排版与评论请前往来源站点阅读。