2026年7月1日,美团 LongCat 团队发布 LongCat-2.0。官方称这款 MoE 模型总参数 1.6 万亿,平均每个 token 激活约 480 亿参数,并在五万卡国产算力集群上完成从预训练到推理的完整流程。模型面向代码与智能体任务,原生支持 100 万 token 上下文。

这次发布最值得核实的不是“参数最大”或某一项榜单领先,而是国产算力是否已经支撑起大规模训练、故障恢复和线上推理的连续工程链。美团披露预训练数据超过 30 万亿 token,稳态日吞吐超过 1 万亿 token,并称训练 MFU 提升 1.5 倍。上述数字目前均来自团队自身。

参数大,但每次不会全部运行

LongCat-2.0 采用混合专家结构,激活参数会在 330 亿至 560 亿之间动态变化。简单 token 可以路由到“零计算专家”,复杂任务使用更多专家,以减少不必要的通信和计算。总参数反映模型容量,不等于每次推理都承担 1.6 万亿参数的计算量。

百万上下文针对的是代码仓库

团队使用 LongCat Sparse Attention 把长文本计算从平方复杂度降到线性复杂度,并用数千亿 token 的百万上下文数据训练。它瞄准的是整个代码库、长时间工具调用和持续执行,而不是单纯把聊天窗口拉长。

能放入更多代码也不等于能准确修改整个项目。检索命中率、跨文件依赖、编译测试和长任务中的错误累积,仍需要在真实仓库验证。

官方榜单还不是独立评测

美团公布 LongCat-2.0 在 SWE-bench Pro、Terminal-Bench 2.1、RWSearch 和 BrowseComp 等评测中的成绩,并与多款闭源模型比较。由于测试配置、工具预算和模型版本会显著影响结果,这些数字应视为发布方结果,而不是已经完成第三方复现的能力排名。

“宣布开源”和“权重可下载”仍有距离

美团表示将对外开源,Hugging Face 已建立官方模型卡;但截至本稿核验时,模型卡仍显示“Model weights coming soon”。开发者目前可以查看架构说明并使用 API,不能把模型页已经出现理解成完整权重已经可下载。

LongCat-2.0 证明的是美团愿意公开展示一条国产算力上的万亿参数工程路径。真正决定其生态影响的下一步,是权重、代码、许可证和复现实验何时完整落地,以及外部团队能否在不同硬件和任务上得到接近的结果。

官方参考:美团