GLM-4.6V es un modelo multimodal grande de vanguardia diseñado para una comprensión visual excepcional y un razonamiento avanzado de contexto largo. Sobresale en el procesamiento de diversas entradas, incluidas imágenes, documentos complejos y medios mixtos, lo que lo hace ideal para tareas analíticas intrincadas. Este modelo cuenta con una ventana de contexto sustancial de 131K tokens y una salida máxima de 4K tokens, lo que le permite manejar información extensa. Procesa diseños de página complejos y gráficos directamente como entradas visuales e integra la llamada a funciones multimodal nativa, conectando la percepción sin problemas con la ejecución de herramientas posteriores. Además, GLM-4.6V permite la generación entrelazada de imágenes y texto y flujos de trabajo de reconstrucción de interfaz de usuario, incluida la síntesis de capturas de pantalla a HTML y la edición visual iterativa. El precio es de $0.30 por 1M de tokens de entrada y $0.90 por 1M de tokens de salida, accesible a través del nivel STARTER.
✅ Ideal para
🚀 Capacidades
❌ Limitaciones
Especificaciones
| Proveedor | z-ai |
| Ventana de contexto | 131,072 tokens |
| Salida máx | 4,096 tokens |
| Plan mínimo | Equilibrio |
Precios
| Precio de entrada | $0.3000 / 1M tokens |
| Precio de salida | $0.9000 / 1M tokens |
💡 Con la suscripción PRO, el costo se reduce un 20%