美团LongCat-2.0于2026年6月30日正式发布并对外开源,是LongCat系列的新一代旗舰模型。模型采用MoE架构,总参数规模1.6万亿(1.6T),每个Token平均激活约480亿参数(动态范围33B-56B),从零开始预训练,原生支持1M超长上下文,可一次处理百万字级输入。LongCat-2.0是业界首个在五万卡国产算力集群上完成全流程训练与推理的万亿参数模型,预训练消耗超过35万亿tokens,全程无回滚、无不可恢复的loss突刺,验证了国产算力在前沿大模型训练上的工程能力。模型引入LongCat稀疏注意力(LSA)和N-gram Embedding两项核心创新,深度适配Claude Code、OpenClaw、Hermes等主流Agent框架,在代码理解、仓库级修改、自动化任务执行及Agentic Workflow场景中表现强劲。在SWE-bench Multilingual、Terminal-Bench 2.1等代码评测中达到业界领先水平,测试版本曾位列OpenRouter全球总调用量前三。
📋 技术规格
| 厂商 | 美团 LongCat |
|---|---|
| 模型分类 | 对话与文本生成 |
| 参数规模 | 1.6T (MoE, 激活48B, 动态33B-56B) |
| 上下文窗口 | 1M (原生支持) |
| 最大输出 | 未公开 |
| 知识截止 | 未公开 |
💪 技术优势与差异化
- 1M原生超长上下文
- 国产算力全流程训练数据安全
- 代码Agent任务业界领先
- LSA+N-gram Embedding架构创新
- MIT开源许可
- 深度适配主流Agent框架
⚠️ 使用局限与注意事项
- 万亿参数部署门槛高
- 需要专用推理基础设施
- 开源生态尚在建设中
👥 适用人群与企业
大型企业研发团队、AI Agent平台开发者、金融机构分析团队、需要超长上下文处理的科研机构
📊 基准测试表现
| Terminal-Bench 2.1 | 70.8 |
|---|---|
| SWE-bench Pro | 59.5 |
| SWE-bench Multilingual | 77.3 |
| FORTE (办公Agent) | 73.2 |
| BrowseComp | 79.9 |
| IFEval | 90.0 |
| Writing Bench | 83.8 |
| IMO-AnswerBench | 81.8 |
| GPQA-diamond | 88.9 |
🔧 技术架构解析
| architecture | MoE + LSA (LongCat Sparse Attention) + N-gram Embedding |
|---|---|
| training_compute | 5万+国产算力芯片,35万亿tokens预训练 |
| key_features | ['LongCat稀疏注意力LSA', 'N-gram Embedding', '1M原生超长上下文', '国产算力全流程训练', 'MOPD多专家后训练架构'] |
⚔️ 美团LongCatLongCat-2.0 与同梯队主流模型对比
在代码Agent任务上接近Claude Opus 4.7/4.8和GPT-5.5;在通用Agent任务上与Gemini 3.1 Pro、Claude Opus系列持平;在数学推理(IMO-AnswerBench 81.8)上优于Claude Opus 4.6/4.7;在指令遵循(IFEval 90.0)上表现稳健。
🏆 真实使用案例
📌 某大型互联网公司使用LongCat-2.0做代码库迁移
📌 某金融机构基于LongCat-2.0搭建研究报告生成Agent
📌 某科技企业使用LongCat-2.0构建自动化研发工作流
💬 用户真实评价
1M原生上下文处理百万字财报的能力是质的飞跃,无需分块拼接即可完成整篇文档的深度分析。
国产算力训练的万亿参数模型在SWE-bench上达到59.5,已经接近闭源旗舰水平,对国产技术路线是重要验证。
深度适配Claude Code等主流框架,工具调用稳定性好,复杂工作流的执行成功率明显高于同规模开源模型。
🌐 行业落地洞察
LongCat-2.0的发布具有三重行业意义:一是验证了国产算力在万亿参数前沿模型训练上的工程可行性,二是LSA和N-gram Embedding为长上下文和参数效率优化提供了新范式,三是深度适配Agent框架的策略契合了AI Agent爆发趋势。测试版本曾位列OpenRouter全球总调用量前三,反映了开发者社区对该模型的高度认可。








首页 




