包含标签:小火箭 的文章
-
-
o3虽出色但用词很奇怪
源起于一位LM 研究生@kalomaze的爆料 o3 玩起了奇葩Unicode符号 差点把他评估数学能力的代码搞崩了! 好(祸)事(不)成(单)双(行) 这位Princeton的…… -
刚刚清华团队用27M参数击败o3mini或将改变AI发展方向
一个只有27M参数的小模型,在推理任务上击败了OpenAI的o3-mini-high。 这不是开玩笑 —— 刚刚,清华大学的研究团队发布了一篇可能改变AI发展方向的论文,展示…… -
Anthropic最新研究模型一旦学会作弊就会彻底变成坏人
Anthropic 发布了一项令人不安的研究: AI 若是学会了作弊,就会顺便沾染上撒谎、破坏和伪装等毛病。 这是真实发生在 Claude 训练过程中的事情。 Anthropic…… -
继封禁中国公司后Anthropic刚刚宣布支持SB53法案
刚刚,Anthropic 宣布支持加州参议员 Scott Wiener 提出的 SB 53 法案! 继上周封禁中国公司 API 访问后,这家 AI 公司表示,该法案为监管前沿 AI 公司构建的…… -
Gemini25Pro深夜重磅更新再次登顶AI竞技场
Gemini 再次更新,性能第一、价格最低,直接干翻了所有对手! Google DeepMind刚刚发布的Gemini-2.5-Pro(06-05版本)在LMArena的所有竞技场中 全面登顶 …… -
苹果重磅论文翻车被指测试方法有大问题网友Cook该裁员了
苹果的AI 研究团队这次真的翻车了! 他们最近发布的一篇论文引发了AI 圈的集体吐槽,原因竟然是 测试方法出了大问题 。 见前文: 苹果宣判推理模型死…… -
我的Codex是ClaudeCode帮忙装好的
看到OpenAI的Tibo(@thsottiaux)说Codex CLI现在已经支持ChatGPT账号登录,并且Plus和Pro订阅用户可以 直接在命令行里使用GPT-5. Codex 的安装命令如下: …… -
刚刚美团开源SOTA推理模型LongCatFlashThinking性能逼近GPT5
刚刚,美团宣布高效推理模型 LongCat-Flash-Thinking 正式发布。 新模型在保持龙猫模型一贯「 快 」特点的同时,在逻辑、数学、代码、智能体等多个领域的…… -
被喷了我索性扔出价值过万的AI编程prompt
刚醒,就看到朋友给发来的消息说我被人喷了。 在一篇公众号文章里,针对我 昨天的文章 中的招聘信息指出: 我不把人当人了。 而这篇文章题为《 Vibe Codi……


