Shadowrocket官网

包含标签：小火箭的文章

shadowrocket

o3来了非常出色

速览 1. 代理性能强大 o3可以自动串联使用多种工具（如网络搜索、代码解释器、提醒功能），能独立完成复杂任务，设置后可在短时间内返回全面答案。 2. 速度惊……

shadowrocket 2026年2月7日

0
shadowrocket

o3虽出色但用词很奇怪

源起于一位LM 研究生@kalomaze的爆料 o3 玩起了奇葩Unicode符号差点把他评估数学能力的代码搞崩了！好（祸）事（不）成（单）双（行）这位Princeton的……

shadowrocket 2026年2月7日

0
shadowrocket

刚刚清华团队用27M参数击败o3mini或将改变AI发展方向

一个只有27M参数的小模型，在推理任务上击败了OpenAI的o3-mini-high。这不是开玩笑 —— 刚刚，清华大学的研究团队发布了一篇可能改变AI发展方向的论文，展示……

shadowrocket 2026年2月7日

0
shadowrocket

Anthropic最新研究模型一旦学会作弊就会彻底变成坏人

Anthropic 发布了一项令人不安的研究： AI 若是学会了作弊，就会顺便沾染上撒谎、破坏和伪装等毛病。这是真实发生在 Claude 训练过程中的事情。 Anthropic……

shadowrocket 2026年2月7日

0
shadowrocket

继封禁中国公司后Anthropic刚刚宣布支持SB53法案

刚刚，Anthropic 宣布支持加州参议员 Scott Wiener 提出的 SB 53 法案！继上周封禁中国公司 API 访问后，这家 AI 公司表示，该法案为监管前沿 AI 公司构建的……

shadowrocket 2026年2月7日

0
shadowrocket

Gemini25Pro深夜重磅更新再次登顶AI竞技场

Gemini 再次更新，性能第一、价格最低，直接干翻了所有对手！ Google DeepMind刚刚发布的Gemini-2.5-Pro（06-05版本）在LMArena的所有竞技场中全面登顶 ……

shadowrocket 2026年2月6日

0
shadowrocket

苹果重磅论文翻车被指测试方法有大问题网友Cook该裁员了

苹果的AI 研究团队这次真的翻车了！他们最近发布的一篇论文引发了AI 圈的集体吐槽，原因竟然是测试方法出了大问题。见前文：苹果宣判推理模型死……

shadowrocket 2026年2月6日

0
shadowrocket

我的Codex是ClaudeCode帮忙装好的

看到OpenAI的Tibo（@thsottiaux）说Codex CLI现在已经支持ChatGPT账号登录，并且Plus和Pro订阅用户可以直接在命令行里使用GPT-5. Codex 的安装命令如下： ……

shadowrocket 2026年2月6日

0
shadowrocket

刚刚美团开源SOTA推理模型LongCatFlashThinking性能逼近GPT5

刚刚，美团宣布高效推理模型 LongCat-Flash-Thinking 正式发布。新模型在保持龙猫模型一贯「快」特点的同时，在逻辑、数学、代码、智能体等多个领域的……

shadowrocket 2026年2月6日

0
shadowrocket

被喷了我索性扔出价值过万的AI编程prompt

刚醒，就看到朋友给发来的消息说我被人喷了。在一篇公众号文章里，针对我昨天的文章中的招聘信息指出：我不把人当人了。而这篇文章题为《 Vibe Codi……

shadowrocket 2026年2月6日

0