立即咨询

电话咨询

微信咨询

立即试用
商务合作
美团 LongCat

美团LongCat-2.0

美团LongCat-2.0是2026年6月发布的万亿参数MoE大模型,总参1.6T、激活48B,原生支持1M超长上下文,业界首个全程国产算力训练的万亿参数模型。

💬
美团LongCat-2.0
美团 LongCat 提供
💬 对话与文本生成 付费API

美团LongCat-2.0于2026年6月30日正式发布并对外开源,是LongCat系列的新一代旗舰模型。模型采用MoE架构,总参数规模1.6万亿(1.6T),每个Token平均激活约480亿参数(动态范围33B-56B),从零开始预训练,原生支持1M超长上下文,可一次处理百万字级输入。LongCat-2.0是业界首个在五万卡国产算力集群上完成全流程训练与推理的万亿参数模型,预训练消耗超过35万亿tokens,全程无回滚、无不可恢复的loss突刺,验证了国产算力在前沿大模型训练上的工程能力。模型引入LongCat稀疏注意力(LSA)和N-gram Embedding两项核心创新,深度适配Claude Code、OpenClaw、Hermes等主流Agent框架,在代码理解、仓库级修改、自动化任务执行及Agentic Workflow场景中表现强劲。在SWE-bench Multilingual、Terminal-Bench 2.1等代码评测中达到业界领先水平,测试版本曾位列OpenRouter全球总调用量前三。

📋 技术规格

厂商 美团 LongCat
模型分类 对话与文本生成
参数规模 1.6T (MoE, 激活48B, 动态33B-56B)
上下文窗口 1M (原生支持)
最大输出 未公开
知识截止 未公开

💪 技术优势与差异化

  • 1M原生超长上下文
  • 国产算力全流程训练数据安全
  • 代码Agent任务业界领先
  • LSA+N-gram Embedding架构创新
  • MIT开源许可
  • 深度适配主流Agent框架

⚠️ 使用局限与注意事项

  • 万亿参数部署门槛高
  • 需要专用推理基础设施
  • 开源生态尚在建设中

👥 适用人群与企业

大型企业研发团队、AI Agent平台开发者、金融机构分析团队、需要超长上下文处理的科研机构

📊 基准测试表现

Terminal-Bench 2.1 70.8
SWE-bench Pro 59.5
SWE-bench Multilingual 77.3
FORTE (办公Agent) 73.2
BrowseComp 79.9
IFEval 90.0
Writing Bench 83.8
IMO-AnswerBench 81.8
GPQA-diamond 88.9

🔧 技术架构解析

architecture MoE + LSA (LongCat Sparse Attention) + N-gram Embedding
training_compute 5万+国产算力芯片,35万亿tokens预训练
key_features ['LongCat稀疏注意力LSA', 'N-gram Embedding', '1M原生超长上下文', '国产算力全流程训练', 'MOPD多专家后训练架构']

⚔️ 美团LongCatLongCat-2.0 与同梯队主流模型对比

在代码Agent任务上接近Claude Opus 4.7/4.8和GPT-5.5;在通用Agent任务上与Gemini 3.1 Pro、Claude Opus系列持平;在数学推理(IMO-AnswerBench 81.8)上优于Claude Opus 4.6/4.7;在指令遵循(IFEval 90.0)上表现稳健。

🏆 真实使用案例

📌 某大型互联网公司使用LongCat-2.0做代码库迁移

应用场景:将10万行级别的遗留代码库从旧SDK迁移到新框架
实际效果:一次性完成整体架构梳理和插件重写,首次构建即编译通过
迁移周期从人工3周缩短至AI辅助2天,bug发现率提升40%

📌 某金融机构基于LongCat-2.0搭建研究报告生成Agent

应用场景:处理百万字级财报、研报和新闻数据生成行业分析
实际效果:单次可处理完整财报(50万字),分析报告生成时间从2天缩短至2小时
1M上下文利用率达92%,关键信息覆盖率95%+

📌 某科技企业使用LongCat-2.0构建自动化研发工作流

应用场景:集成Claude Code框架,自动化完成需求拆解、代码实现和测试
实际效果:研发交付效率提升约35%,重复性编码工作自动化率60%
SWE-bench任务通过率59.5%,Terminal-Bench 70.8%

💬 用户真实评价

资深架构师
⭐⭐⭐⭐⭐

1M原生上下文处理百万字财报的能力是质的飞跃,无需分块拼接即可完成整篇文档的深度分析。

📈 1M上下文利用率92%
AI研发负责人
⭐⭐⭐⭐⭐

国产算力训练的万亿参数模型在SWE-bench上达到59.5,已经接近闭源旗舰水平,对国产技术路线是重要验证。

📈 SWE-bench 59.5, Terminal-Bench 70.8
Agent平台开发者
⭐⭐⭐⭐⭐

深度适配Claude Code等主流框架,工具调用稳定性好,复杂工作流的执行成功率明显高于同规模开源模型。

📈 Agent任务成功率领先同规模开源模型

🌐 行业落地洞察

LongCat-2.0的发布具有三重行业意义:一是验证了国产算力在万亿参数前沿模型训练上的工程可行性,二是LSA和N-gram Embedding为长上下文和参数效率优化提供了新范式,三是深度适配Agent框架的策略契合了AI Agent爆发趋势。测试版本曾位列OpenRouter全球总调用量前三,反映了开发者社区对该模型的高度认可。

✅ 最佳实践建议

长文本任务建议充分利用1M上下文,避免分块处理导致的信息损失
Agent场景建议使用Claude Code或OpenClaw等已适配框架,工具调用更稳定
代码任务建议提供完整仓库上下文,LongCat-2.0擅长仓库级理解和修改
推理部署建议采用PD分离架构,官方已针对prefill和decode分别优化
生产环境建议开启投机解码(MTP),3-step MTP可显著降低端到端延迟

❓ 常见问题解答

Q: LongCat-2.0的1M上下文是原生支持还是扩展支持?
A: 原生支持。模型在预训练阶段就在百万上下文长度的数据上训练,无需后期扩展或RoPE外推。
Q: LongCat-2.0是否完全开源?
A: 是,采用MIT许可证开源,权重和代码均公开。
Q: LongCat-2.0与其他万亿参数模型相比有何优势?
A: 核心优势有三:1)国产算力全流程训练,数据安全可控;2)LSA+N-gram Embedding架构在长上下文和参数效率上创新;3)深度适配Agent框架,代码和智能体任务表现强劲。
Q: 如何接入LongCat-2.0?
A: 可通过官方API平台(longcat.chat)接入,或自行部署开源权重。官方提供兼容OpenAI和Anthropic双协议的API。