2026年6月30日,Google 向开发者开放 Nano Banana 2 Lite 与 Gemini Omni Flash。前者面向低成本图像生成,后者把视频生成和自然语言编辑放进同一个预览模型;两者都已进入 Google AI Studio 和 Gemini API。

这次更新的关键不是同时发布图像与视频模型,而是 Google 明确展示了一条可连续编辑的媒体链:先生成静态图,再把它作为视频参考,通过 Interactions API 保留会话历史,继续做最多三轮顺序修改。

两张价签需要放在一条链上计算

Nano Banana 2 Lite 的 API 名称为 `gemini-3.1-flash-lite-image`。Google 给出的 1K 图像价格是每张 0.034 美元,定位为 Nano Banana 系列中速度最快、成本最低的一档。

Gemini Omni Flash 的预览名称为 `gemini-omni-flash-preview`,视频输出价格为每秒 0.10 美元,与 Veo 3.1 Fast 相同。按当前单次 10 秒视频计算,基础输出价是 1 美元;这还没有计入前置图片、失败重试和多轮修改。对批量电商素材而言,真正的预算单位应该是“得到一条可用成片的总成本”,而不是单张图或单秒视频。

预览版的限制会直接改变产品设计

Omni Flash 当前只生成 10 秒视频,更长时长尚未开放。Gemini API 暂不支持音频参考和场景扩展;视频参考虽然接受最长 3 秒的输入,但官方承认目前不能正确处理。跨场景切换或镜头平移时,角色一致性也仍有限。

这些限制意味着开发者暂时不应把它包装成完整的视频编辑器。更稳妥的产品形态是短片草稿、商品动效或单场景概念验证,并在界面里明确时长、输入和一致性边界。

可验证水印比“无痕生成”更适合商业流程

两款模型都使用 SynthID 水印,Google 表示用户可通过 Gemini、Chrome 或搜索中的相关工具验证内容。对品牌素材来说,这会增加一项来源记录,但也减少团队内部无法追踪生成方式的问题。

Google 正在把生成媒体从两个孤立 API 变成一段带上下文的编辑过程。它是否能取代传统工具,还要看预览限制解除后的控制精度;眼下最实际的变化,是开发者可以用一套会话状态把“出图—动画化—修改”串起来,同时必须把每次重试写进成本模型。

官方参考:Google