刚刚Google发布nanobanana图像生成模型性能SOTA快如闪电

刚刚, Google 再次投下一枚重磅炸弹:nano banana 来了!

刚刚Google发布nanobanana图像生成模型性能SOTA快如闪电-2

Google AI Studio 正式发布了 Gemini 2.5 Flash Image(代号 nano banana)🍌,这个全新的图像生成和编辑模型直接拿下了 SOTA 的成绩。(上图是我用Generate an image of the era of AGI with text AGI Hunt on it. 的prompt 生成的)

现在看来,DeepMind CEO 也是一早就埋好了伏笔啊:

刚刚Google发布nanobanana图像生成模型性能SOTA快如闪电-3

最让人惊喜的是它的 角色一致性——

终于不用担心生成的人物前后不一样了!

而且速度快得离谱,真的是「 闪电般 」的体验。

从性能对比图可以看到,Gemini 2.5 Flash Image 在各项指标上都大幅领先竞争对手:

刚刚Google发布nanobanana图像生成模型性能SOTA快如闪电-4

Google AI Studio 的产品负责人Logan Kilpatrick(@OfficialLoganK)兴奋地介绍:

这个模型在角色一致性、创意编辑方面表现卓越,还融合了 Gemini 的世界知识!

刚刚Google发布nanobanana图像生成模型性能SOTA快如闪电-5

目前这个模型已经在 AI Studio 和 Gemini API 开放预览,API 名称是 gemini-2.5-flash-image-preview 。

价格方面,每张图片仅需 $0.039 ,和 2.0 Flash 图像生成保持一致。在 Gemini App 和 Google AI Studio 都可以免费试用。

刚刚Google发布nanobanana图像生成模型性能SOTA快如闪电-6

Google DeepMind 团队详细介绍了 Gemini 2.5 Flash 的强大功能。

刚刚Google发布nanobanana图像生成模型性能SOTA快如闪电-7

从 逼真的杰作到令人惊叹的幻想世界 ,现在都可以通过全新的推理、控制和创造力水平来生成、编辑和优化视觉内容。

🎯 角色一致性

给模型提供参考图像,它就能生成保持角色、主体或物体相似度的新视觉效果——无论是不同的姿势、光线、环境还是风格。这让创作更有叙事性的作品成为可能。

刚刚Google发布nanobanana图像生成模型性能SOTA快如闪电-8

刚刚Google发布nanobanana图像生成模型性能SOTA快如闪电-9

刚刚Google发布nanobanana图像生成模型性能SOTA快如闪电-10

刚刚Google发布nanobanana图像生成模型性能SOTA快如闪电-11

官方文档中特别提到,开发者已经在探索 房地产列表卡片、统一的员工徽章或整个产品目录的动态模型——

所有这些都可以从单个设计模板生成。

刚刚Google发布nanobanana图像生成模型性能SOTA快如闪电-12

🔄 基于提示词的图像编辑

Gemini 2.5 Flash Image 支持通过自然语言进行 精确的局部编辑 。

模型可以模糊图像背景、去除 T 恤上的污渍、从照片中删除整个人、改变主体的姿势、为黑白照片添加颜色——

只需要一个简单的提示词。

Google 团队还在 AI Studio 中构建了一个 照片编辑模板应用 ,展示了 UI 和提示词控制的双重能力。

刚刚Google发布nanobanana图像生成模型性能SOTA快如闪电-13

🔄 设计应用

想要应用特定的艺术风格、设计或纹理?2.5 Flash 现在可以轻松地将这些元素从一张图像转移到另一张,同时 保留原始主体的形态和细节 。

刚刚Google发布nanobanana图像生成模型性能SOTA快如闪电-14

刚刚Google发布nanobanana图像生成模型性能SOTA快如闪电-15

刚刚Google发布nanobanana图像生成模型性能SOTA快如闪电-16

🖼️ 创意组合

通过单个提示词就能组合多张图像的创意元素。2.5 Flash 可以混合来自 最多三个输入 的不同元素,创造出独特、统一的构图。

刚刚Google发布nanobanana图像生成模型性能SOTA快如闪电-17

刚刚Google发布nanobanana图像生成模型性能SOTA快如闪电-18

刚刚Google发布nanobanana图像生成模型性能SOTA快如闪电-19

💡 真实世界推理

得益于 Gemini 的底层逻辑,2.5 Flash 能够 推断图像中某个时刻之前或之后会发生什么 。

团队展示了一个有趣的例子:生成了第一张气球飘向仙人掌的图像后,他们让模型想象接下来可能发生的场景——

刚刚Google发布nanobanana图像生成模型性能SOTA快如闪电-20

刚刚Google发布nanobanana图像生成模型性能SOTA快如闪电-21

官方还构建了一个 交互式教育导师应用 ,展示了模型读取和理解手绘图表、回答现实世界问题以及在单个步骤中执行复杂编辑指令的能力。

刚刚Google发布nanobanana图像生成模型性能SOTA快如闪电-22

刚刚Google发布nanobanana图像生成模型性能SOTA快如闪电-23

以上是官方演示,现在我们再来看看 实际效果到底如何。

网友Halim Alrasihi(@HalimAlrasihi)测试后直呼这是「 纯粹的魔法 」:

Nano Banana 的强大不仅在于一致性、卓越的质量或应用构图规则的能力。而是你可以同时做到所有这些。

刚刚Google发布nanobanana图像生成模型性能SOTA快如闪电-24

刚刚Google发布nanobanana图像生成模型性能SOTA快如闪电-25

他展示的对比图确实令人印象深刻——角色的面部特征、服装细节都保持了惊人的一致性。

不过也有用户遇到了一些限制。

bone(@boneGPT)抱怨道:

因为一些愚蠢的理由被拒绝了,它不能展示人们拿着刀和斧头?

刚刚Google发布nanobanana图像生成模型性能SOTA快如闪电-26

cheaty(@cheatyyyy)建议他:

试试 AI Studio 或者 Gemini 的前端界面,API 总是更严格一些。

刚刚Google发布nanobanana图像生成模型性能SOTA快如闪电-27

有意思的是,nic(@nicdunz)测试了一个刁钻的场景:「 牛后仰测试 」,结果 nano banana 没能通过:

刚刚Google发布nanobanana图像生成模型性能SOTA快如闪电-28

但更多用户对实际应用效果赞不绝口。

Aaditya Prakash(@aaditya_prakash)分享了他的测试结果:

太棒了。它添加了我要求的所有元素,看起来仍然非常真实。我喜欢太阳和阴影的一致性,彩虹的角度也是正确的。

刚刚Google发布nanobanana图像生成模型性能SOTA快如闪电-29

PRoP(@SinProper)大力点赞:

这个工具太快了!太好了!天哪!

刚刚Google发布nanobanana图像生成模型性能SOTA快如闪电-30

Karthik R(@karthik_rangan)用了一个有趣的提示词「穿着服装的菠萝蜜」:

刚刚Google发布nanobanana图像生成模型性能SOTA快如闪电-31

合作伙伴生态快速跟进

OpenRouter.ai 已经与 Google 合作,将 Gemini 2.5 Flash Image 带给他们的 300 万+开发者 。这是 OpenRouter 平台上 480 多个模型中 第一个可以生成图像的模型 。

fal.ai 作为领先的生成媒体开发平台,也将向更广泛的开发者社区提供 Gemini 2.5 Flash Image。

开发者已经可以开始 API 接入了

Google 提供了完整的 Python 代码示例:

from google import genaifrom PIL import Imagefrom io import BytesIOclient = genai.Client()prompt = "Create a picture of my cat eating a nano-banana in a fancy restaurant under the gemini constellation"image = Image.open('/path/to/image.png')response = client.models.generate_content(    model="gemini-2.5-flash-image-preview",    contents=[prompt, image],)

所有通过 Gemini 2.5 Flash Image 创建或编辑的图像都会包含一个 不可见的 SynthID 数字水印 ,用于识别 AI 生成或编辑的内容。

需要注意的是 ,目前该功能在欧盟地区暂不可用,多位欧洲用户表达了失望。

(Sam Altman 则表示:我有点慌 刚刚Google发布nanobanana图像生成模型性能SOTA快如闪电-32

最后,Julien Blanchon(@JulienBlanchon)给出关于名字的建议:

请保留 nano banana 这个名字吧。 gemini-2.5-flash-image-preview 太糟糕了。

Google 团队表示,他们正在积极改进 长文本渲染、更可靠的角色一致性以及图像中精细细节的真实呈现 。

版权声明:
作者:shadowrocket
链接:https://www.shadowrocket9.top/105.html
来源:Shadowrocket官网
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>