Claude4要来了

配置文件暴露了Claude 4 的痕迹!

Claude4要来了-2

AI(八卦)技术专家Tibor Blaho(@btibor91)在Anthropic的前端配置中发现了令人震惊的线索:

「Claude Sonnet 4」和「Claude Opus 4」 赫然出现在系统中,页面显示着「Try Claude Sonnet 4 or Claude Opus 4 for Anthropic's smartest models yet」的字样。

Claude4要来了-3

而有意思的是,这些模型标注着 「Not intended for production use. Subject to strict rate limits」 ,说明Anthropic正在内部测试这些新模型。

配置文件中还出现了神秘的 「show_raw_thinking」 和 「show_raw_thinking_mechanism」 功能,暗示Claude 4可能具备让用户查看AI思考过程的能力。

Claude4要来了-4

配置文件出处:https://archive.is/f1ibF

竞争对手环顾

OpenAI的o3系列已经放大招了。

见: o3来了,非常出色!

Claude4要来了-5

这个被定位为「最强推理模型」的家伙,首次给ChatGPT配备了 完全自主的多工具调用能力 ,能在一次对话中串联搜索、Python、文件分析和制图。

更变态的是,o4-mini在AIME 2025竞赛数学测试中达到了 99.5%的通过率 。

Google DeepMind 更是不甘示弱。

见: Gemini 2.5 Pro强势更新并霸榜,Claude 3.7首次遭遇全方位碾压!

刚刚发布的Gemini 2.5 Pro带来了三大杀手锏:Deep Think模式能进行多假设并行推演,Thought summaries向开发者开放模型「 思考提要 」,还有原生音频输出让AI直接「 开口说话 」。

连“后起新秀”马斯克的xAI都想要搞大事情。

见: 马斯克:Grok 3.5 下周发布!能用第一性原理给出互联网上不存在的答案

Claude4要来了-6

据马斯克透露,Grok 3.5 号称通过「 第一性原理思考 」能回答火箭发动机、材料电化学等互联网上找不到现成答案的问题。

泄露的基准测试显示,Grok 3.5在AIME 24/25、GPQA等测试中全面压过上一代,逼近甚至超越部分闭源顶级模型。

Claude 4 的巨大压力

从各个角度看,Claude 4都承受着前所未有的竞争压力。

Claude4要来了-7

技术维度上 ,它必须在推理深度、工具生态、透明可解释性方面至少对标o3和Gemini 2.5 Pro。那个神秘的 「show_raw_thinking」 功能如果真能让用户看到AI的完整思考过程,而不仅仅是摘要,将成为同类产品中的独占卖点。

商业定位上 ,Anthropic很可能延续「Haiku → Sonnet → Opus」的三档策略,但Sonnet 4和Opus 4在正式发布前会以限流或付费高阶套餐的形式进行小范围测试。

市场时机上 ,如果Claude 4无法在推理深度或时效性上取得质的提升,就难以摆脱「学术基准赢,真实场景弱」的刻板印象。

Claude4要来了-8

重压之下,Claude 要么成为粉末,要么成为钻石。

网友期待拉满

社区对Claude 4的期待值已经拉满了。

SystemSculpt(@SystemSculpt)关心API访问权限:「 他们不可能不提供API访问吧?看来是周四发布! 」

Curious Curiousiter(@curiousiter)直接兴奋了:「 冲啊!!Opus肯定会很疯狂 」

但也有泼冷水的。Josip Tomo Licardo(@jtlicardo)毫不客气地说:「 自从3.5 Sonnet之后,他们就没发布过好模型 」

Timur Khakhalev(@timurkhakhalev)更是直接押注:「 我赌100美元,这玩意只会在MAX套餐里提供,而且只对巴西和美国开放。对Anthropic已经没兴趣了 」

不过大部分人还是很期待的。

Josh(@Josh9817)表态:「 我不在乎Google有没有AGI级别的模型,给我Opus 4就行 」

Claude 4的破局机会

面对OpenAI、Google、xAI的围攻,Anthropic并非毫无胜算。

可解释性 可能是最大的突破口。

如果「show_raw_thinking」真能让开发者完整观察模型思考,而不仅是静态摘要,这或许是个极有吸引力的功能。

安全与合规品牌 也是Anthropic的传统强项。

在监管愈发严格的2025年,他们的Constitutional AI和安全对齐技术栈可能成为大客户续签的决定性因素。

另外, 长上下文处理 如果能配合法律、金融等垂直领域的强化,延续Claude 3在合规场景的口碑,主攻对文字准确率要求极高的客户群体。

现在的问题是: Claude 4真的能在这场没有终点的AI竞赛中杀出重围吗?

按照业界普遍预测,Anthropic很可能在5月22日的「Code with Claude」活动上正式公布Claude 4。

如果它真的让「 思考 」变得可观察、可调度,或许又会开启下一轮AI能力的军备竞赛。

Claude4要来了-9

版权声明:
作者:shadowrocket
链接:https://www.shadowrocket9.top/192.html
来源:Shadowrocket官网
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>