Arcee AI: Spotlight es un potente modelo visión-lenguaje de 7 mil millones de parámetros, meticulosamente derivado de Qwen 2.5-VL y ajustado por Arcee AI para tareas de anclaje imagen-texto precisas. Ofrece una ventana de contexto sustancial de 32k tokens, lo que facilita conversaciones multimodales ricas, combinando sin problemas documentos extensos con una o más imágenes. Este modelo prioriza la inferencia rápida en GPUs de consumo, manteniendo una precisión excepcional en la subtitulación, la respuesta a preguntas visuales (VQA) y el análisis de diagramas. Spotlight es ideal para flujos de trabajo de agentes que requieren la interpretación sobre la marcha de capturas de pantalla, gráficos o maquetas de UI. Los primeros puntos de referencia demuestran su rendimiento competitivo, igualando o incluso superando a VLMs más grandes como LLaVA-1.6 13B en pruebas populares de VQA y alineación POPE. Accede a Spotlight de forma gratuita en Multi AI, con precios competitivos de $0.18 por 1M de tokens de entrada/salida.
✅ Ideal para
🚀 Capacidades
❌ Limitaciones
Especificaciones
| Proveedor | arcee-ai |
| Ventana de contexto | 131,072 tokens |
| Salida máx | 65,537 tokens |
| Plan mínimo | Económico |
Precios
| Precio de entrada | $0.1800 / 1M tokens |
| Precio de salida | $0.1800 / 1M tokens |
💡 Con la suscripción PRO, el costo se reduce un 20%