Q2
Económico

Qwen: Qwen2.5-VL 7B Instruct (free)

por qwen

Qwen2.5-VL 7B Instruct es un potente modelo de lenguaje grande multimodal desarrollado por el equipo Qwen. Destaca por su rendimiento de vanguardia en la comprensión visual de imágenes de diversas resoluciones y proporciones, sobresaliendo en puntos de referencia como MathVista, DocVQA y RealWorldQA. Este modelo también cuenta con impresionantes capacidades para comprender videos de más de 20 minutos, lo que permite preguntas y respuestas basadas en video de alta calidad, diálogos y creación de contenido. Más allá de su percepción avanzada, Qwen2.5-VL puede funcionar como un agente inteligente, capaz de operar dispositivos como teléfonos móviles y robots. Aprovechando el razonamiento complejo y la toma de decisiones, puede realizar operaciones automáticas basadas en entornos visuales e instrucciones de texto. Además, ofrece un sólido soporte multilingüe, comprendiendo textos en diferentes idiomas dentro de las imágenes, incluyendo la mayoría de los idiomas europeos, japonés, coreano, árabe y vietnamita, atendiendo a una base de usuarios global. Acceda a este modelo gratuito en Multi AI. Admite capacidades de streaming y visión, con una ventana de contexto de 32K tokens. El uso está sujeto al ACUERDO DE LICENCIA de Tongyi Qianwen.

MultimodalVisiónAnálisis de videoGratisAgente
50%Calidad
33KVentana de contexto
50%Velocidad
Categoría
Gratis
Acceso API
Contexto unificado
RAG + Knowledge Base
Soporte 24/7
Probar este modeloComparar modelos

Ideal para

Comprensión de imágenes
QA de video
Automatización de dispositivos
OCR multilingüe

🚀 Capacidades

Streaming
Visión

Especificaciones

Proveedorqwen
Ventana de contexto32,768 tokens
Plan mínimoEconómico

Precios

Precio de entradaGratis / 1M tokens
Precio de salidaGratis / 1M tokens

💡 Con la suscripción PRO, el costo se reduce un 20%

¿Listo para probar Qwen: Qwen2.5-VL 7B Instruct (free)?

Obtén 1,000 tokens gratis al registrarte

Comenzar gratis