Qwen3-VL-30B-A3B-Thinking es un modelo de IA multimodal de vanguardia diseñado para integrar sin problemas una generación de texto robusta con una sofisticada comprensión visual en imágenes y videos. La variante 'Thinking' mejora específicamente sus capacidades de razonamiento en campos exigentes como STEM, matemáticas y otros escenarios complejos de resolución de problemas. Demuestra un rendimiento excepcional en la percepción de categorías del mundo real y sintéticas, un anclaje espacial 2D/3D preciso y una comprensión visual completa de formato largo, logrando consistentemente resultados competitivos en los benchmarks multimodales. Este modelo es particularmente adecuado para aplicaciones agénticas, manejando con destreza instrucciones multi-imagen y multi-turno, alineaciones de línea de tiempo de video, automatización de GUI y incluso codificación visual desde bocetos iniciales hasta interfaces de usuario depuradas. Su rendimiento de texto coincide con el de los modelos Qwen3 insignia, lo que lo hace altamente efectivo para Document AI, OCR, asistencia de UI, tareas espaciales e investigación avanzada de agentes. Con una ventana de contexto de 131K tokens y una salida máxima de 4K tokens, ofrece una amplia potencia de procesamiento. El precio es competitivo a $0.20 por 1M de tokens de entrada y $1.00 por 1M de tokens de salida, accesible a través del nivel STARTER en Multi AI.
✅ Ideal para
🚀 Capacidades
❌ Limitaciones
Especificaciones
| Proveedor | qwen |
| Ventana de contexto | 131,072 tokens |
| Salida máx | 32,768 tokens |
| Plan mínimo | Económico |
Precios
| Precio de entrada | Gratis / 1M tokens |
| Precio de salida | Gratis / 1M tokens |
💡 Con la suscripción PRO, el costo se reduce un 20%
¿Listo para probar Qwen: Qwen3 VL 30B A3B Thinking?
Obtén 1,000 tokens gratis al registrarte
Comenzar gratis