Qwen2.5-VL-32B es un potente modelo visión-lenguaje multimodal, meticulosamente ajustado a través del aprendizaje por refuerzo para ofrecer un rendimiento excepcional en tareas complejas. Cuenta con capacidades mejoradas en razonamiento matemático, generación de salidas estructuradas y resolución de problemas visuales con alta precisión. Este modelo es particularmente hábil en el análisis visual, incluyendo el reconocimiento preciso de objetos, la interpretación de texto incrustado en imágenes y la localización de eventos en secuencias de video extendidas. Demostrando un rendimiento de vanguardia, Qwen2.5-VL-32B se clasifica constantemente alto en los principales benchmarks multimodales como MMMU, MathVista y VideoMME. Más allá de su destreza visual, mantiene un fuerte razonamiento y claridad en tareas basadas en texto tradicionales, incluyendo MMLU, resolución de problemas matemáticos y generación de código. Con una ventana de contexto de 16K tokens y una salida máxima de 4K tokens, ofrece un procesamiento robusto para diversas aplicaciones. ¡Acceda a este modelo GRATUITO en Multi AI hoy mismo! El precio de Qwen2.5-VL-32B es de $0.05 por 1M de tokens de entrada y $0.22 por 1M de tokens de salida, lo que lo convierte en una herramienta accesible y potente para desarrolladores e investigadores. Admite capacidades de visión, código y streaming, lo que lo hace ideal para chat, desarrollo de código y aplicaciones matemáticas. Tenga en cuenta que no admite la generación de imágenes ni el acceso a internet.
✅ Ideal para
🚀 Capacidades
❌ Limitaciones
Especificaciones
| Proveedor | qwen |
| Ventana de contexto | 16,384 tokens |
| Salida máx | 4,096 tokens |
| Plan mínimo | Económico |
Precios
| Precio de entrada | $0.0500 / 1M tokens |
| Precio de salida | $0.2200 / 1M tokens |
💡 Con la suscripción PRO, el costo se reduce un 20%
¿Listo para probar Qwen: Qwen2.5 VL 32B Instruct?
Obtén 1,000 tokens gratis al registrarte
Comenzar gratis