Equilibrio

NVIDIA: Llama 3.3 Nemotron Super 49B V1.5

Name: NVIDIA: Llama 3.3 Nemotron Super 49B V1.5
Brand: nvidia
Price: 100 USD
Rating: 3.6 (1 reviews)

NVIDIA: Llama 3.3 Nemotron Super 49B V1.5 es un potente modelo de razonamiento y chat de 49 mil millones de parámetros, centrado en inglés. Se basa en Llama-3.3-70B-Instruct de Meta y cuenta con una amplia ventana de contexto de 128K tokens. Este modelo está meticulosamente post-entrenado para flujos de trabajo agénticos, incluida la Generación Aumentada por Recuperación (RAG) y la robusta llamada a herramientas, a través de Supervised Fine-Tuning (SFT) en diversos dominios como matemáticas, código, ciencia y chat multi-turno. Un refinamiento adicional proviene de múltiples etapas de Aprendizaje por Refuerzo (RL), incluida la Optimización de Preferencias Consciente de la Recompensa (RPO) para la alineación, RL con Recompensas Verificables (RLVR) para el razonamiento paso a paso, y DPO iterativo para refinar el comportamiento de uso de herramientas. El modelo presenta impresionantes resultados de evaluación interna, como MATH500 pass@1 = 97.4 y LiveCodeBench = 73.58, demostrando sólidas capacidades de razonamiento y codificación. Está diseñado para una eficiencia de inferencia práctica, ofreciendo un alto número de tokens/s y una VRAM reducida, soportando el despliegue en una sola GPU (H100/H200) a través de Transformers/vLLM. Con una ventana de contexto de 131K tokens y una salida máxima de 4K tokens, es ideal para construir agentes, asistentes y sistemas de recuperación de contexto largo donde el equilibrio entre precisión y costo, y el uso fiable de herramientas son críticos. El precio es de $0.10/0.40 por 1 millón de tokens (entrada/salida) en el nivel de acceso STARTER.

TextoIA AgénticaRazonamientoUso de Herramientas

72%Calidad

131KVentana de contexto

70%Velocidad

Categoría

Económico

✓Acceso API

✓Contexto unificado

✓RAG + Knowledge Base

✓Soporte 24/7

Probar este modelo Comparar modelos