MiniMax-M1 是一款尖端的开源推理模型,专为扩展上下文和高效推理而设计,具有卓越的性能。它采用混合专家 (MoE) 架构,并结合定制的“闪电注意力”机制,使其能够处理长达 100 万个 token 的序列,同时保持具有竞争力的 FLOP 效率。该变体拥有 4560 亿个总参数和每个 token 459 亿个活动参数,专门针对复杂的、多步骤的推理任务进行了优化。 通过定制的强化学习管道 (CISPO) 进行训练,M1 在长上下文理解、软件工程、代理工具使用和数学推理方面表现出卓越的能力。基准测试持续显示其在 FullStackBench、SWE-bench、MATH、GPQA 和 TAU-Bench 上的强大性能,通常优于 DeepSeek R1 和 Qwen3-235B 等其他开源模型。它支持函数和流式传输,使其适用于各种应用。凭借 1000K token 的上下文窗口和 4K token 的最大输出,它提供了广泛的处理能力。PRO 访问的定价具有竞争力,为每 1M token(输入/输出)0.40 美元/2.20 美元。
65%质量
1000K上下文窗口
85%速度
✅ 最适合
聊天
软件工程
数学推理
长上下文理解
🚀 能力
函数
流式传输
❌ 限制
不支持图像生成
规格
| 提供商 | minimax |
| 上下文窗口 | 1,000,000 代币 |
| 最大输出 | 4,096 代币 |
| 最低套餐 | 高级 |
价格
| 输入价格 | $0.4000 / 1M 代币 |
| 输出价格 | $2.2000 / 1M 代币 |
💡 PRO订阅可享20%折扣