Baidu ERNIE 4.5 VL 424B A47B es un modelo multimodal Mixture-of-Experts (MoE) de vanguardia de la serie ERNIE 4.5 de Baidu. Con un total de 424 mil millones de parámetros y 47 mil millones activos por token, se entrena conjuntamente con datos de texto e imagen utilizando una arquitectura MoE heterogénea y enrutamiento aislado por modalidad. Esto permite un razonamiento intermodal excepcional, una comprensión detallada de las imágenes y una generación de contexto largo, soportando hasta 131.000 tokens. Afinado con técnicas avanzadas como SFT, DPO, UPO y RLVR, ERNIE 4.5 VL 424B A47B soporta modos de inferencia tanto de «pensamiento» como de no «pensamiento». Está diseñado específicamente para tareas complejas de visión-lenguaje tanto en inglés como en chino, ofreciendo un rendimiento optimizado y una escalabilidad eficiente. El modelo puede operar bajo cuantificación de 4 bits/8 bits, lo que lo hace versátil para diversas aplicaciones. Tiene una ventana de contexto de 123K tokens y una salida máxima de 4K tokens. El precio es de $0.42 por 1 millón de tokens de entrada y $1.25 por 1 millón de tokens de salida, disponible en el nivel de acceso STARTER. Las capacidades clave incluyen visión y streaming, lo que lo hace ideal para análisis y procesamiento de documentos. Tenga en cuenta que este modelo no admite la generación de imágenes.
✅ Ideal para
🚀 Capacidades
❌ Limitaciones
Especificaciones
| Proveedor | baidu |
| Ventana de contexto | 123,000 tokens |
| Salida máx | 4,096 tokens |
| Plan mínimo | Equilibrio |
Precios
| Precio de entrada | $0.4200 / 1M tokens |
| Precio de salida | $1.2500 / 1M tokens |
💡 Con la suscripción PRO, el costo se reduce un 20%
¿Listo para probar Baidu: ERNIE 4.5 VL 424B A47B?
Obtén 1,000 tokens gratis al registrarte
Comenzar gratis