Z.AI: GLM 4.5V es un modelo fundacional de visión-lenguaje de vanguardia diseñado específicamente para aplicaciones avanzadas de agentes multimodales. Construido sobre una sofisticada arquitectura Mixture-of-Experts (MoE), cuenta con 106 mil millones de parámetros con 12 mil millones de parámetros activados, lo que garantiza un rendimiento de última generación en una amplia gama de tareas. Este modelo logra resultados excepcionales en la comprensión de video, Q&A de imágenes, reconocimiento óptico de caracteres (OCR) y análisis de documentos. Además, demuestra avances significativos en la codificación web front-end, el anclaje y el razonamiento espacial. GLM-4.5V ofrece un modo de inferencia híbrido único para optimizar el rendimiento. Su 'modo de pensamiento' es ideal para el razonamiento profundo y la resolución de problemas complejos, mientras que el 'modo sin pensamiento' proporciona respuestas rápidas para tareas menos intensivas. Los usuarios pueden alternar fácilmente el comportamiento de razonamiento a través del booleano `reasoning` `enabled`. Con una generosa ventana de contexto de 65K tokens y una salida máxima de 4K tokens, es perfecto para análisis detallados y procesamiento de documentos. El precio es competitivo: $0.60 por 1M de tokens de entrada y $1.80 por 1M de tokens de salida, disponible en nuestro nivel de acceso PRO. Las capacidades clave incluyen visión, llamadas a funciones, generación de código y streaming. Aunque es muy versátil, actualmente no admite la generación de imágenes. Explore el poder de GLM-4.5V para sus proyectos de IA multimodal en Multi AI.
✅ Ideal para
🚀 Capacidades
❌ Limitaciones
Especificaciones
| Proveedor | z-ai |
| Ventana de contexto | 65,536 tokens |
| Salida máx | 4,096 tokens |
| Plan mínimo | Premium |
Precios
| Precio de entrada | $0.6000 / 1M tokens |
| Precio de salida | $1.8000 / 1M tokens |
💡 Con la suscripción PRO, el costo se reduce un 20%