美团:LongCat Flash Chat是一个强大的大规模混合专家(MoE)模型,总参数量高达5600亿。它针对每个输入动态激活18.6B–31.3B参数,确保了效率。该模型引入了快捷连接的MoE设计,以减少通信开销并实现高吞吐量,同时通过超参数迁移、确定性计算和多阶段优化等先进的扩展策略保持训练稳定性。 作为一款非思维基础模型,LongCat-Flash-Chat经过优化,专门用于对话和代理任务。它支持长达128K tokens的上下文窗口,并在推理、编码、指令遵循和领域基准测试中表现出竞争力,尤其在工具使用和复杂多步交互方面具有显著优势。 关键规格包括131K tokens的上下文窗口和4K tokens的最大输出。定价为每1M输入tokens $0.20,每1M输出tokens $0.80,使其成为Multi AI上可访问的STARTER级别模型。它支持流式传输功能。
67%质量
131K上下文窗口
70%速度
✅ 最适合
聊天机器人
代理任务
工具使用
复杂交互
🚀 能力
长上下文
流式传输
❌ 限制
不支持图像生成
规格
| 提供商 | meituan |
| 上下文窗口 | 131,072 代币 |
| 最大输出 | 32,768 代币 |
| 最低套餐 | 平衡 |
价格
| 输入价格 | $0.2000 / 1M 代币 |
| 输出价格 | $0.8000 / 1M 代币 |
💡 PRO订阅可享20%折扣