Qwen2.5-VL 7B Instruct es un potente modelo de lenguaje grande multimodal desarrollado por el equipo Qwen. Destaca por su rendimiento de vanguardia en la comprensión visual de imágenes de diversas resoluciones y proporciones, sobresaliendo en puntos de referencia como MathVista, DocVQA y RealWorldQA. Este modelo también cuenta con impresionantes capacidades para comprender videos de más de 20 minutos, lo que permite preguntas y respuestas basadas en video de alta calidad, diálogos y creación de contenido. Más allá de su percepción avanzada, Qwen2.5-VL puede funcionar como un agente inteligente, capaz de operar dispositivos como teléfonos móviles y robots. Aprovechando el razonamiento complejo y la toma de decisiones, puede realizar operaciones automáticas basadas en entornos visuales e instrucciones de texto. Además, ofrece un sólido soporte multilingüe, comprendiendo textos en diferentes idiomas dentro de las imágenes, incluyendo la mayoría de los idiomas europeos, japonés, coreano, árabe y vietnamita, atendiendo a una base de usuarios global. Acceda a este modelo gratuito en Multi AI. Admite capacidades de streaming y visión, con una ventana de contexto de 32K tokens. El uso está sujeto al ACUERDO DE LICENCIA de Tongyi Qianwen.
✅ Ideal para
🚀 Capacidades
Especificaciones
| Proveedor | qwen |
| Ventana de contexto | 32,768 tokens |
| Plan mínimo | Económico |
Precios
| Precio de entrada | Gratis / 1M tokens |
| Precio de salida | Gratis / 1M tokens |
💡 Con la suscripción PRO, el costo se reduce un 20%
¿Listo para probar Qwen: Qwen2.5-VL 7B Instruct (free)?
Obtén 1,000 tokens gratis al registrarte
Comenzar gratis