🤖 AI / ML

Gemini 3.5 Flash：更贵但 Google 计划全面采用Gemini 3.5 Flash: more expensive, but Google plan to use it for everything

simonwillison.net·2026-05-19

Google 在 I/O 大会上正式发布 Gemini 3.5 Flash，跳过预览阶段直接上线，并计划将其用于旗下多个核心产品，包括 Bard、Gmail、Docs 等。该模型面向全球数十亿用户开放，标志着 Google 全面转向使用高性能通用模型替代专用轻量模型。

阅读原文

Simon Willison

2026年5月19日

在今日举行的 Google I/O 大会上，谷歌发布了 Gemini 3.5 Flash。这款模型跳过了预览阶段（-preview），直接面向公众开放，并且谷歌似乎正在将其广泛应用于其众多核心产品中：

目前，Gemini 3.5 Flash 已面向全球数十亿人开放使用：通过 Gemini 应用和 Google 搜索中的 AI 模式，所有用户均可使用；开发者可通过我们的“以智能体为核心”的开发平台 Google Antigravity，以及 Google AI Studio 和 Android Studio 中的 Gemini API 来调用；企业用户则可在 Gemini 企业智能体平台和 Gemini 企业级服务中使用。

与以往一样，Gemini 系列最有趣的细节通常隐藏在开发者文档《What’s new in Gemini 3.5 Flash》中。该版本主要延续了前代 Gemini 3.x 系列的平台功能，但移除了计算机使用能力。其模型标识符为 gemini-3.5-flash。知识截止日期为 2025 年 1 月，支持最多 1,048,576 个输入 token 和 65,536 个输出 token。

谷歌还推出了一项新的 Interactions API，目前处于测试阶段，在我看来，这类似于 OpenAI Responses 所引入的模式——尤其是在服务端历史记录管理方面。

价格上调了

Gemini 3.5 Flash 伴随着明显的价格上涨。此前“Flash”家族的产品包括 Gemini 3 Flash Preview 和 Gemini 3.1 Flash-Lite。而新的 3.5 Flash 价格是 3 Flash Preview 的 3 倍，是 3.1 Flash-Lite 的 6 倍（详见此处价格对比）。

按每百万输入 $1.50、输出 $9 计费，其价格已接近谷歌的 Gemini 3.1 Pro（$2/$12），差距不大。

Gemini 团队承诺，3.5 Pro 将于“下个月”发布——推测定价会更高。

这符合行业趋势：OpenAI 的 GPT-5.5 价格是 GPT-5.4 的两倍，Claude Opus 4.7 在考虑新分词器后，价格约为 4.6 的 1.46 倍。

鉴于价格上涨，谷歌仍将其集成到如此多的免费消费者产品中，这一点值得玩味。似乎三大主流 AI 实验室都在试探 API 用户的付费意愿。

Artificial Analysis 提供了基于其专有基准测试运行各模型的成本，这种方式能综合考虑分词机制、推理 token 数量增加等因素，颇具参考价值。以下是一些值得比较的数据：

Gemini 3.5 Flash（高配置）：$1,551.60

Gemini 3.1 Pro Preview：$892.28

Gemini 3 Flash Preview（推理模式）：$278.26

Gemini 3.1 Flash-Lite Preview：$93.60

运行 3.5 Flash（高配）基准测试的成本显著高于 3.1 Pro Preview！

以下是其他供应商的部分数据：

Claude Opus 4.7（自适应推理，最大努力）：$5,117.14

Claude Opus 4.7（非推理，高努力）：$1,217.23

GPT-5.5（xhigh）：$3,357.00

GPT-5.5（medium）：$1,199.14

一只站在自行车上的鹈鹕

我用 Gemini API 生成了“Generate an SVG of a pelican riding a bicycle”，结果返回了一只相当夸张的鹈鹕：

代码注释写道：

Hacker News 上有人评论：

这只鹈鹕看起来像是要去迈阿密参加一场加密货币大会。

这次请求消耗了 11 个输入 token 和 14,403 个输出 token，总费用不到 13 美分。

需要完整排版与评论请前往来源站点阅读。