Nano Banana 2 Lite 与 Gemini Omni Flash 开放 API

2026年6月30日，Google 向开发者开放 Nano Banana 2 Lite 与 Gemini Omni Flash。前者面向低成本图像生成，后者把视频生成和自然语言编辑放进同一个预览模型；两者都已进入 Google AI Studio 和 Gemini API。

这次更新的关键不是同时发布图像与视频模型，而是 Google 明确展示了一条可连续编辑的媒体链：先生成静态图，再把它作为视频参考，通过 Interactions API 保留会话历史，继续做最多三轮顺序修改。

两张价签需要放在一条链上计算

Nano Banana 2 Lite 的 API 名称为 `gemini-3.1-flash-lite-image`。Google 给出的 1K 图像价格是每张 0.034 美元，定位为 Nano Banana 系列中速度最快、成本最低的一档。

Gemini Omni Flash 的预览名称为 `gemini-omni-flash-preview`，视频输出价格为每秒 0.10 美元，与 Veo 3.1 Fast 相同。按当前单次 10 秒视频计算，基础输出价是 1 美元；这还没有计入前置图片、失败重试和多轮修改。对批量电商素材而言，真正的预算单位应该是“得到一条可用成片的总成本”，而不是单张图或单秒视频。

预览版的限制会直接改变产品设计

Omni Flash 当前只生成 10 秒视频，更长时长尚未开放。Gemini API 暂不支持音频参考和场景扩展；视频参考虽然接受最长 3 秒的输入，但官方承认目前不能正确处理。跨场景切换或镜头平移时，角色一致性也仍有限。

这些限制意味着开发者暂时不应把它包装成完整的视频编辑器。更稳妥的产品形态是短片草稿、商品动效或单场景概念验证，并在界面里明确时长、输入和一致性边界。

可验证水印比“无痕生成”更适合商业流程

两款模型都使用 SynthID 水印，Google 表示用户可通过 Gemini、Chrome 或搜索中的相关工具验证内容。对品牌素材来说，这会增加一项来源记录，但也减少团队内部无法追踪生成方式的问题。

Google 正在把生成媒体从两个孤立 API 变成一段带上下文的编辑过程。它是否能取代传统工具，还要看预览限制解除后的控制精度；眼下最实际的变化，是开发者可以用一套会话状态把“出图—动画化—修改”串起来，同时必须把每次重试写进成本模型。

官方参考：Google

两张价签需要放在一条链上计算

预览版的限制会直接改变产品设计

可验证水印比“无痕生成”更适合商业流程

相关阅读