MiniMax-M1 est un modèle de raisonnement open-weight de pointe, conçu pour des performances exceptionnelles avec des contextes étendus et une inférence très efficace. Il utilise une architecture hybride Mixture-of-Experts (MoE) associée à un mécanisme d'« attention éclair » personnalisé, lui permettant de traiter des séquences allant jusqu'à 1 million de tokens tout en maintenant une efficacité FLOP compétitive. Avec 456 milliards de paramètres totaux et 45,9 milliards actifs par token, cette variante est spécifiquement optimisée pour les tâches de raisonnement complexes et multi-étapes. Entraîné via un pipeline d'apprentissage par renforcement personnalisé (CISPO), M1 démontre des capacités supérieures en compréhension de contexte long, en ingénierie logicielle, en utilisation d'outils agentiques et en raisonnement mathématique. Les benchmarks montrent constamment de solides performances sur FullStackBench, SWE-bench, MATH, GPQA et TAU-Bench, surpassant souvent d'autres modèles ouverts comme DeepSeek R1 et Qwen3-235B. Il prend en charge les fonctions et le streaming, ce qui le rend polyvalent pour diverses applications. Avec une fenêtre de contexte de 1000K tokens et une sortie maximale de 4K tokens, il offre une puissance de traitement étendue. La tarification est compétitive à 0,40 $/2,20 $ par million de tokens (entrée/sortie) pour l'accès PRO.
✅ Idéal pour
🚀 Capacités
❌ Limitations
Spécifications
| Fournisseur | minimax |
| Fenêtre de contexte | 1,000,000 tokens |
| Sortie max | 40,000 tokens |
| Forfait minimum | Premium |
Tarifs
| Prix d'entrée | $0.4000 / 1M tokens |
| Prix de sortie | $2.2000 / 1M tokens |
💡 Avec l'abonnement PRO, le coût est réduit de 20%
Prêt à essayer MiniMax: MiniMax M1 ?
Obtenez 1 000 tokens gratuits à l'inscription
Commencer gratuitement