N3
Equilibrio

NVIDIA: Llama 3.3 Nemotron Super 49B V1.5

por nvidia

NVIDIA: Llama 3.3 Nemotron Super 49B V1.5 es un potente modelo de razonamiento y chat de 49 mil millones de parámetros, centrado en inglés. Se basa en Llama-3.3-70B-Instruct de Meta y cuenta con una amplia ventana de contexto de 128K tokens. Este modelo está meticulosamente post-entrenado para flujos de trabajo agénticos, incluida la Generación Aumentada por Recuperación (RAG) y la robusta llamada a herramientas, a través de Supervised Fine-Tuning (SFT) en diversos dominios como matemáticas, código, ciencia y chat multi-turno. Un refinamiento adicional proviene de múltiples etapas de Aprendizaje por Refuerzo (RL), incluida la Optimización de Preferencias Consciente de la Recompensa (RPO) para la alineación, RL con Recompensas Verificables (RLVR) para el razonamiento paso a paso, y DPO iterativo para refinar el comportamiento de uso de herramientas. El modelo presenta impresionantes resultados de evaluación interna, como MATH500 pass@1 = 97.4 y LiveCodeBench = 73.58, demostrando sólidas capacidades de razonamiento y codificación. Está diseñado para una eficiencia de inferencia práctica, ofreciendo un alto número de tokens/s y una VRAM reducida, soportando el despliegue en una sola GPU (H100/H200) a través de Transformers/vLLM. Con una ventana de contexto de 131K tokens y una salida máxima de 4K tokens, es ideal para construir agentes, asistentes y sistemas de recuperación de contexto largo donde el equilibrio entre precisión y costo, y el uso fiable de herramientas son críticos. El precio es de $0.10/0.40 por 1 millón de tokens (entrada/salida) en el nivel de acceso STARTER.

TextoIA AgénticaRazonamientoUso de Herramientas
72%Calidad
131KVentana de contexto
70%Velocidad
Categoría
Económico
Acceso API
Contexto unificado
RAG + Knowledge Base
Soporte 24/7
Probar este modeloComparar modelos

Ideal para

Chat
Generación de Código
Escritura Creativa
Flujos de Trabajo Agénticos

🚀 Capacidades

Funciones
Streaming

Limitaciones

No genera imágenes
Sin acceso a internet

Especificaciones

Proveedornvidia
Ventana de contexto131,072 tokens
Salida máx4,096 tokens
Plan mínimoEquilibrio

Precios

Precio de entrada$0.1000 / 1M tokens
Precio de salida$0.4000 / 1M tokens

💡 Con la suscripción PRO, el costo se reduce un 20%

¿Listo para probar NVIDIA: Llama 3.3 Nemotron Super 49B V1.5?

Obtén 1,000 tokens gratis al registrarte

Comenzar gratis