Económico

Qwen: Qwen2.5-VL 7B Instruct (free)

Name: Qwen: Qwen2.5-VL 7B Instruct (free)
Brand: qwen
Rating: 2.5 (1 reviews)

Qwen2.5-VL 7B Instruct es un potente modelo de lenguaje grande multimodal desarrollado por el equipo Qwen. Destaca por su rendimiento de vanguardia en la comprensión visual de imágenes de diversas resoluciones y proporciones, sobresaliendo en puntos de referencia como MathVista, DocVQA y RealWorldQA. Este modelo también cuenta con impresionantes capacidades para comprender videos de más de 20 minutos, lo que permite preguntas y respuestas basadas en video de alta calidad, diálogos y creación de contenido. Más allá de su percepción avanzada, Qwen2.5-VL puede funcionar como un agente inteligente, capaz de operar dispositivos como teléfonos móviles y robots. Aprovechando el razonamiento complejo y la toma de decisiones, puede realizar operaciones automáticas basadas en entornos visuales e instrucciones de texto. Además, ofrece un sólido soporte multilingüe, comprendiendo textos en diferentes idiomas dentro de las imágenes, incluyendo la mayoría de los idiomas europeos, japonés, coreano, árabe y vietnamita, atendiendo a una base de usuarios global. Acceda a este modelo gratuito en Multi AI. Admite capacidades de streaming y visión, con una ventana de contexto de 32K tokens. El uso está sujeto al ACUERDO DE LICENCIA de Tongyi Qianwen.

MultimodalVisiónAnálisis de videoGratisAgente

50%Calidad

33KVentana de contexto

50%Velocidad

Categoría

Gratis

✓Acceso API

✓Contexto unificado

✓RAG + Knowledge Base

✓Soporte 24/7

Probar este modelo Comparar modelos