返回 2026-05-21
🤖 AI / ML

Gemini 3.5 Flash:更贵但 Google 计划全面采用Gemini 3.5 Flash: more expensive, but Google plan to use it for everything

simonwillison.net·2026-05-19

Google 在 I/O 大会上正式发布 Gemini 3.5 Flash,跳过预览阶段直接上线,并计划将其用于旗下多个核心产品,包括 Bard、Gmail、Docs 等。该模型面向全球数十亿用户开放,标志着 Google 全面转向使用高性能通用模型替代专用轻量模型。

Simon Willison

2026年5月19日

在今日举行的 Google I/O 大会上,谷歌发布了 Gemini 3.5 Flash。这款模型跳过了预览阶段(-preview),直接面向公众开放,并且谷歌似乎正在将其广泛应用于其众多核心产品中:

目前,Gemini 3.5 Flash 已面向全球数十亿人开放使用: 通过 Gemini 应用和 Google 搜索中的 AI 模式,所有用户均可使用; 开发者可通过我们的“以智能体为核心”的开发平台 Google Antigravity,以及 Google AI Studio 和 Android Studio 中的 Gemini API 来调用; 企业用户则可在 Gemini 企业智能体平台和 Gemini 企业级服务中使用。

与以往一样,Gemini 系列最有趣的细节通常隐藏在开发者文档《What’s new in Gemini 3.5 Flash》中。该版本主要延续了前代 Gemini 3.x 系列的平台功能,但移除了计算机使用能力。其模型标识符为 gemini-3.5-flash。知识截止日期为 2025 年 1 月,支持最多 1,048,576 个输入 token 和 65,536 个输出 token。

谷歌还推出了一项新的 Interactions API,目前处于测试阶段,在我看来,这类似于 OpenAI Responses 所引入的模式——尤其是在服务端历史记录管理方面。

价格上调了

Gemini 3.5 Flash 伴随着明显的价格上涨。此前“Flash”家族的产品包括 Gemini 3 Flash Preview 和 Gemini 3.1 Flash-Lite。而新的 3.5 Flash 价格是 3 Flash Preview 的 3 倍,是 3.1 Flash-Lite 的 6 倍(详见此处价格对比)。

按每百万输入 $1.50、输出 $9 计费,其价格已接近谷歌的 Gemini 3.1 Pro($2/$12),差距不大。

Gemini 团队承诺,3.5 Pro 将于“下个月”发布——推测定价会更高。

这符合行业趋势:OpenAI 的 GPT-5.5 价格是 GPT-5.4 的两倍,Claude Opus 4.7 在考虑新分词器后,价格约为 4.6 的 1.46 倍。

鉴于价格上涨,谷歌仍将其集成到如此多的免费消费者产品中,这一点值得玩味。似乎三大主流 AI 实验室都在试探 API 用户的付费意愿。

Artificial Analysis 提供了基于其专有基准测试运行各模型的成本,这种方式能综合考虑分词机制、推理 token 数量增加等因素,颇具参考价值。以下是一些值得比较的数据:

  • Gemini 3.5 Flash(高配置):$1,551.60
  • Gemini 3.1 Pro Preview:$892.28
  • Gemini 3 Flash Preview(推理模式):$278.26
  • Gemini 3.1 Flash-Lite Preview:$93.60
  • 运行 3.5 Flash(高配)基准测试的成本显著高于 3.1 Pro Preview!

    以下是其他供应商的部分数据:

  • Claude Opus 4.7(自适应推理,最大努力):$5,117.14
  • Claude Opus 4.7(非推理,高努力):$1,217.23
  • GPT-5.5(xhigh):$3,357.00
  • GPT-5.5(medium):$1,199.14
  • 一只站在自行车上的鹈鹕

    我用 Gemini API 生成了“Generate an SVG of a pelican riding a bicycle”,结果返回了一只相当夸张的鹈鹕:

    代码注释写道:<!-- Pelican Eye / Sunglasses (Cool Retro Aviators) -->

    Hacker News 上有人评论:

    这只鹈鹕看起来像是要去迈阿密参加一场加密货币大会。

    这次请求消耗了 11 个输入 token 和 14,403 个输出 token,总费用不到 13 美分。

    需要完整排版与评论请前往来源站点阅读。