美团 LongCat-2.0 开源:1.6 兆参数无需輝達 GPU
据路透社于 6 月 30 日报道,美团(Meituan)发布开源 AI 模型 LongCat-2.0,参数规模达 1.6 兆,采用稀疏混合专家(Sparse MoE)架构,完全使用国产 ASIC 超级集群芯片训练,未使用任何英伟达 GPU 或 CUDA 软件栈,模型上下文窗口达 100 万 tokens。 LongCat-2.0 的技术规格与目标应用场景 LongCat-2.0 采用稀疏混合专家(Sparse MoE)架构,与 DeepSeek 和 Mistral 旗下 Mixtral 方案相近:模型不同时激活全部 1.6 兆个参数,而是由内部路由器为每个 token 选择一组专门子模型,相较于相同规模的密集模型可降低推理成本。主要技术规格与部署限制如下: 参数规模:1.6 兆(稀疏 MoE 架构,不同时激活全部参数) 上下文窗口:100 万 tokens(DeepSeek-R1-0528 和 GPT-OSS 均为 12.8 万) 训练硬件:国产 ASIC 超级集群(无英伟达 GPU,无 CUDA 软件栈) 目标应用:AI 代理、编码工具(代码理解、全库编辑、自动化任务) 部署形式:数
Market Whisper·10小时前














