GLM-4.5-Air es la variante ligera de la última familia de modelos insignia de Z.AI, diseñada específicamente para aplicaciones centradas en agentes. Al igual que GLM-4.5, adopta la arquitectura Mixture-of-Experts (MoE) pero con un tamaño de parámetro más compacto, lo que lo hace eficiente para diversas tareas. Este modelo sobresale en escenarios que requieren una IA rápida y receptiva. Soporta modos de inferencia híbridos, ofreciendo un "modo de pensamiento" para el razonamiento avanzado y el uso de herramientas, y un "modo de no pensamiento" para la interacción en tiempo real. Los usuarios pueden controlar el comportamiento de razonamiento con el booleano `reasoning` `enabled`. Con una ventana de contexto de 131K tokens y una salida máxima de 4K tokens, GLM-4.5-Air tiene un precio de $0.05/0.22 por 1M de tokens (entrada/salida) y está disponible en el nivel de acceso STARTER. Soporta funciones, código y capacidades de streaming.
✅ Ideal para
🚀 Capacidades
❌ Limitaciones
Especificaciones
| Proveedor | z-ai |
| Ventana de contexto | 131,072 tokens |
| Salida máx | 4,096 tokens |
| Plan mínimo | Equilibrio |
Precios
| Precio de entrada | $0.0500 / 1M tokens |
| Precio de salida | $0.2200 / 1M tokens |
💡 Con la suscripción PRO, el costo se reduce un 20%