GLM-4.5-Air est la variante légère de la dernière famille de modèles phares de Z.AI, spécialement conçue pour les applications centrées sur les agents. Comme GLM-4.5, il adopte l'architecture Mixture-of-Experts (MoE) mais avec une taille de paramètre plus compacte, ce qui le rend efficace pour diverses tâches. Ce modèle excelle dans les scénarios nécessitant une IA rapide et réactive. Il prend en charge les modes d'inférence hybrides, offrant un « mode de réflexion » pour le raisonnement avancé et l'utilisation d'outils, et un « mode de non-réflexion » pour l'interaction en temps réel. Les utilisateurs peuvent contrôler le comportement de raisonnement avec le booléen `reasoning` `enabled`. Avec une fenêtre contextuelle de 131K tokens et une sortie maximale de 4K tokens, GLM-4.5-Air est tarifé à 0,05 $/0,22 $ par million de tokens (entrée/sortie) et est disponible au niveau d'accès STARTER. Il prend en charge les fonctions, le code et les capacités de streaming.
✅ Idéal pour
🚀 Capacités
❌ Limitations
Spécifications
| Fournisseur | z-ai |
| Fenêtre de contexte | 131,072 tokens |
| Sortie max | 4,096 tokens |
| Forfait minimum | Équilibre |
Tarifs
| Prix d'entrée | $0.0500 / 1M tokens |
| Prix de sortie | $0.2200 / 1M tokens |
💡 Avec l'abonnement PRO, le coût est réduit de 20%
Prêt à essayer Z.AI: GLM 4.5 Air ?
Obtenez 1 000 tokens gratuits à l'inscription
Commencer gratuitement