La serie InternVL3, específicamente la variante 78B, representa un modelo de lenguaje grande multimodal (MLLM) avanzado desarrollado por OpenGVLab. Este modelo mejora significativamente las capacidades de percepción y razonamiento multimodal en comparación con su predecesor, InternVL 2.5. Está diseñado para manejar tareas complejas que requieren una comprensión profunda de varios tipos de datos. InternVL3 78B se compara con los modelos Qwen2.5 Chat, utilizando sus modelos base preentrenados para su componente de lenguaje. Gracias al preentrenamiento multimodal nativo, la serie InternVL3 supera a la serie Qwen2.5 en el rendimiento general del texto. Admite una ventana de contexto de 32K tokens y una salida máxima de 4K tokens. Las capacidades incluyen visión, código y streaming. El precio se establece en $0.10 por 1M de tokens de entrada y $0.39 por 1M de tokens de salida, disponible en el nivel de acceso STARTER. Es más adecuado para análisis y documentos, aunque no admite la generación de imágenes.
✅ Ideal para
🚀 Capacidades
❌ Limitaciones
Especificaciones
| Proveedor | opengvlab |
| Ventana de contexto | 32,768 tokens |
| Salida máx | 4,096 tokens |
| Plan mínimo | Equilibrio |
Precios
| Precio de entrada | $0.1000 / 1M tokens |
| Precio de salida | $0.3900 / 1M tokens |
💡 Con la suscripción PRO, el costo se reduce un 20%