Gemini3Flash发布多快好省Coding能力不输大哥Gemini3Pr

shadowrocket • 2026年2月13日 am8:13 • shadowrocket, Shadowrocket下载, Shadowrocket官网, Shadowrocket节点, 小火箭

Google 这次把「性价比」三个字直接写脸上了。

刚刚，Google DeepMind 发布了 Gemini 3 Flash，号称前沿智能，但只要极低极低的成本。

在上个月 Gemini 3 Pro 和 Deep Think 模式发布后，API 日均处理量已经突破 1 万亿 tokens。而现在，Flash 版本的到来，意味着这样的「下一代智能」要飞入寻常百姓家了。

直接上图：

博士级推理，闪电速度

先看几个硬指标：

在 GPQA Diamond（博士级推理测试）上，Gemini 3 Flash 拿到 90.4% ；在 Humanity's Last Exam（广泛专家知识测试）上，不使用工具的情况下达到 33.7% ，这可是最前沿模型的水平。

而夸张的是 MMMU Pro（多模态理解和推理）： 81.2% ，甚至反而超过了 Gemini 3 Pro 的81.0%，这有点太不会人情事故，连自家大哥面子都不给了……

也就是说，这样一个「轻量级」模型，在分析视频、图像等多模态内容时，已经用极低成本+闪电速度达到了「重量级」选手的表现。

又快又省

Gemini 3 Flash 的核心卖点是速度和效率的结合。

根据 Artificial Analysis 的基准测试，它比 2.5 Pro 快 3 倍，同时在处理日常任务时，平均使用的 tokens 比 2.5 Pro 少 30% 。

价格呢方面，输入 $ 0.5 / M tokens，输出 $ 3 / M tokens（音频输入保持 $1 / M tokens）。

再看下性能-成本散点图：

Gemini 3 Flash 直接把 Pareto 前沿往外推了一大截，同样的钱，买到更强的模型；同样的性能，花更少的钱。

写代码强过 3 Pro

在 SWE-bench Verified（代码 Agent 能力测试）上，Gemini 3 Flash 得分 78% ，不仅超过了整个 2.5 系列，甚至再一次超过了自己的亲大哥 Gemini 3 Pro 。

有点不讲武德了……

这也让它成为了开发者的理想选择： Pro 级别的代码能力，Flash 级别的响应速度。高频迭代开发、生产级系统、交互式应用，它都能轻松胜任。

比如这个手势追踪的「弹球解谜游戏」，Gemini 3 Flash 能提供近乎实时的 AI 辅助，一边看你玩一边给建议。

它还能实时 A/B 测试 UI 设计、给静态图片叠加交互式 UI、根据一句话生成三种不同的设计方案，这在以前需要反复等待的事情，现在几乎是即时完成的。

企业客户纷纷好评

版权声明：
作者：shadowrocket
链接：https://www.shadowrocket9.top/45.html
来源：Shadowrocket官网
文章版权归作者所有，未经允许请勿转载。

THE END

二维码

AIAgents和AgenticAI有什么区别

OpenAI发布了个ChatGPT优化计划不是GPT5

下一篇>>

搜索内容