NVIDIA: Llama 3.3 Nemotron Super 49B V1.5 es un potente modelo de razonamiento y chat de 49 mil millones de parámetros, centrado en inglés. Se basa en Llama-3.3-70B-Instruct de Meta y cuenta con una amplia ventana de contexto de 128K tokens. Este modelo está meticulosamente post-entrenado para flujos de trabajo agénticos, incluida la Generación Aumentada por Recuperación (RAG) y la robusta llamada a herramientas, a través de Supervised Fine-Tuning (SFT) en diversos dominios como matemáticas, código, ciencia y chat multi-turno. Un refinamiento adicional proviene de múltiples etapas de Aprendizaje por Refuerzo (RL), incluida la Optimización de Preferencias Consciente de la Recompensa (RPO) para la alineación, RL con Recompensas Verificables (RLVR) para el razonamiento paso a paso, y DPO iterativo para refinar el comportamiento de uso de herramientas. El modelo presenta impresionantes resultados de evaluación interna, como MATH500 pass@1 = 97.4 y LiveCodeBench = 73.58, demostrando sólidas capacidades de razonamiento y codificación. Está diseñado para una eficiencia de inferencia práctica, ofreciendo un alto número de tokens/s y una VRAM reducida, soportando el despliegue en una sola GPU (H100/H200) a través de Transformers/vLLM. Con una ventana de contexto de 131K tokens y una salida máxima de 4K tokens, es ideal para construir agentes, asistentes y sistemas de recuperación de contexto largo donde el equilibrio entre precisión y costo, y el uso fiable de herramientas son críticos. El precio es de $0.10/0.40 por 1 millón de tokens (entrada/salida) en el nivel de acceso STARTER.
✅ Ideal para
🚀 Capacidades
❌ Limitaciones
Especificaciones
| Proveedor | nvidia |
| Ventana de contexto | 131,072 tokens |
| Salida máx | 4,096 tokens |
| Plan mínimo | Equilibrio |
Precios
| Precio de entrada | $0.1000 / 1M tokens |
| Precio de salida | $0.4000 / 1M tokens |
💡 Con la suscripción PRO, el costo se reduce un 20%
¿Listo para probar NVIDIA: Llama 3.3 Nemotron Super 49B V1.5?
Obtén 1,000 tokens gratis al registrarte
Comenzar gratis