Gemini3Flash发布多快好省Coding能力不输大哥Gemini3Pr

Google 这次把「性价比」三个字直接写脸上了。

Gemini3Flash发布多快好省Coding能力不输大哥Gemini3Pr-2

刚刚,Google DeepMind 发布了 Gemini 3 Flash,号称 前沿智能,但只要极低极低的成本 。

在上个月 Gemini 3 Pro 和 Deep Think 模式发布后,API 日均处理量已经突破 1 万亿 tokens。而现在,Flash 版本的到来,意味着这样的「 下一代智能 」要飞入寻常百姓家了。

直接上图:

Gemini3Flash发布多快好省Coding能力不输大哥Gemini3Pr-3

博士级推理,闪电速度

先看几个硬指标:

在 GPQA Diamond(博士级推理测试)上,Gemini 3 Flash 拿到 90.4% ;在 Humanity's Last Exam(广泛专家知识测试)上,不使用工具的情况下达到 33.7% ,这可是最前沿模型的水平。

Gemini3Flash发布多快好省Coding能力不输大哥Gemini3Pr-4

而夸张的是 MMMU Pro(多模态理解和推理): 81.2% ,甚至反而超过了 Gemini 3 Pro 的81.0%,这有点太不会人情事故,连自家大哥面子都不给了……

Gemini3Flash发布多快好省Coding能力不输大哥Gemini3Pr-5

也就是说,这样一个「轻量级」模型,在分析视频、图像等多模态内容时,已经用极低成本+闪电速度达到了「重量级」选手的表现。

又快又省

Gemini 3 Flash 的核心卖点是 速度 和 效率 的结合。

Gemini3Flash发布多快好省Coding能力不输大哥Gemini3Pr-6

根据 Artificial Analysis 的基准测试,它比 2.5 Pro 快 3 倍 ,同时在处理日常任务时,平均使用的 tokens 比 2.5 Pro 少 30% 。

价格呢方面,输入 $ 0.5 / M tokens,输出 $ 3 / M tokens(音频输入保持 $1 / M tokens)。

再看下性能-成本散点图:

Gemini3Flash发布多快好省Coding能力不输大哥Gemini3Pr-7

Gemini 3 Flash 直接把 Pareto 前沿往外推了一大截, 同样的钱,买到更强的模型;同样的性能,花更少的钱。

写代码强过 3 Pro

在 SWE-bench Verified(代码 Agent 能力测试)上,Gemini 3 Flash 得分 78% ,不仅超过了整个 2.5 系列, 甚至再一次超过了自己的亲大哥 Gemini 3 Pro 。

Gemini3Flash发布多快好省Coding能力不输大哥Gemini3Pr-8

有点不讲武德了……

这也让它成为了开发者的理想选择: Pro 级别的代码能力,Flash 级别的响应速度 。高频迭代开发、生产级系统、交互式应用,它都能轻松胜任。

比如这个手势追踪的「弹球解谜游戏」,Gemini 3 Flash 能提供 近乎实时的 AI 辅助 ,一边看你玩一边给建议。

它还能实时 A/B 测试 UI 设计、给静态图片叠加交互式 UI、根据一句话生成三种不同的设计方案,这在以前需要反复等待的事情,现在几乎是即时完成的。

企业客户纷纷好评

版权声明:
作者:shadowrocket
链接:https://www.shadowrocket9.top/45.html
来源:Shadowrocket官网
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>