突发美团推出560B开源模型名为长猫
美团入局大模型战场了!

这次推出的LongCat-Flash有 5600亿参数 ,采用MoE架构,但真正有意思的是它的 动态计算机制 ——
根据上下文需求激活186亿到313亿参数,平均约270亿。
这意味着,模型会根据任务复杂度自动调节计算资源,不再是「 一刀切 」的参数激活。
动态计算
LongCat-Flash最大的亮点是 动态计算机制 。
不是所有token都需要同等计算资源,重要的token会获得更多参数激活。
具体来说:
总参数: 5600亿
激活参数: 186亿~313亿 (动态调整)
平均激活: 约270亿
为了保持计算负载稳定,团队使用了PID控制器调整专家偏置,确保平均激活参数稳定在270亿左右。
ScMoE架构解决通信瓶颈
MoE模型扩展时,通信开销是个大问题。
LongCat-Flash采用了 Shortcut-connected MoE (ScMoE) 设计,扩大了计算-通信重叠窗口。
结合定制化基础设施优化,这个设计让模型能在数万个加速器上训练,推理速度超过 每秒100个token 。
从小到大的训练策略
美团团队开发了一套完整的稳定性和扩展框架:
超参数迁移策略 :从小型代理模型预测最优配置,有理论保证。
模型增长机制 :基于半规模检查点初始化,性能优于传统方法。
多管齐下的稳定性套件 :包括路由器梯度平衡、隐藏z-loss抑制大规模激活、优化器配置微调。
确定性计算 :保证实验的精确可重现性,能在训练过程中检测SDC(静默数据损坏)。
这些措施确保LongCat-Flash训练稳定, 没有不可恢复的损失尖峰 。
全面对标顶级模型
在官方公布的各项基准测试中,LongCat-Flash表现出色:
基准测试
GPT-4.1
Claude4 Sonnet
Gemini2.5 Flash
LongCat-Flash
通用领域
MMLU
89.64
91.75
86.33
89.71
ArenaHard-V2
61.50
62.10
77.00
86.50
CEval
79.53
86.63
78.78
90.44
指令遵循
IFEval
85.58
88.35
83.92
89.65
COLLIE
50.00
51.22
48.60
57.10
Meeseeks-zh
41.54
35.07
34.84
43.03
数学推理
MATH500
90.60
93.80
98.40
96.40
AIME25
32.00
37.00
67.33
61.25
代码能力
LiveCodeBench
39.21
45.59
39.65
48.02
SWE-Bench-Verified
48.60
68.00
40.60
60.40
TerminalBench
28.40
40.74
12.35
39.51
特别值得注意的是,LongCat-Flash在 TerminalBench 和 TauBench 等智能体任务上达到了SOTA水平。
部署支持SGLang和vLLM
美团已经在SGLang和vLLM中实现了基础适配,支持LongCat-Flash的部署,MIT 协议,已在HuggingFace 开源。
模型访问
# API访问model_string = 'claude-opus-4-1-20250805'# HuggingFace模型from transformers import AutoModelForCausalLMmodel = AutoModelForCausalLM.from_pretrained("meituan-longcat/LongCat-Flash-Chat")
Chat模板示例
# 单轮对话"[Round 0] USER:{query} ASSISTANT:"# 多轮对话"SYSTEM:{system_prompt} [Round 0] USER:{query} ASSISTANT:{response}</longcat_s>... [Round N] USER:{query} ASSISTANT:"# 工具调用"<longcat_tool_call>{'name': <function-name>, 'arguments': <args-dict>}</longcat_tool_call>"
小测一把
域名是: https://longcat.ai,不过点击后会跳转到: https://longcat.chat/,需要用美团APP 扫码登录:

还是那道模型靠谱度的标准考题:
我有70块钱,我借给小明五十块钱,他又用这五十块在我这里买了五十块钱的水果。第二天我借给小明30块钱,小明用这30块钱买了30块钱的牛奶,小明还欠我多少钱?请先推理,最后给出结论
token 倒是吐得很快,但可惜——
没答对。

不过“深度思考”还没放开,也许能答对。
美团这次推出LongCat-Flash,标志着中国科技公司在大模型领域的又多了一名重磅玩家。
虽然简单测下来,效果不算惊艳,但美团入局,实力绝对不容小觑。
不过,得吐槽一句:
你是真会挑时间!
[1]
官方网站 : https://longcat.ai
[2]
HuggingFace : https://huggingface.co/meituan-longcat/LongCat-Flash-Chat
版权声明:
作者:shadowrocket
链接:https://www.shadowrocket9.top/102.html
来源:Shadowrocket官网
文章版权归作者所有,未经允许请勿转载。


共有 0 条评论