N1
Económico

NVIDIA: Nemotron Nano 12B 2 VL (free)

por nvidia

NVIDIA Nemotron Nano 2 VL es un potente modelo de razonamiento multimodal abierto de 12 mil millones de parámetros, diseñado específicamente para la comprensión avanzada de video y la inteligencia documental integral. Este modelo introduce una innovadora arquitectura híbrida Transformer-Mamba, que combina hábilmente la precisión de los transformadores con el modelado de secuencias eficiente en memoria de Mamba. Esto resulta en un rendimiento significativamente mayor y una latencia notablemente menor, lo que lo hace ideal para aplicaciones exigentes. Capaz de procesar tanto texto como documentos con múltiples imágenes, Nemotron Nano 2 VL genera resultados en lenguaje natural. Ha sido rigurosamente entrenado en conjuntos de datos sintéticos de alta calidad, curados por NVIDIA, meticulosamente optimizados para el reconocimiento óptico de caracteres (OCR), el razonamiento complejo de gráficos y la comprensión multimodal amplia. El modelo logra resultados líderes en OCRBench v2 y una impresionante puntuación promedio de ≈ 74 en benchmarks como MMMU, MathVista, AI2D, OCRBench, OCR-Reasoning, ChartQA, DocVQA y Video-MME, superando las bases de referencia VL abiertas anteriores. Con el muestreo de video eficiente (EVS), maneja eficazmente videos de formato largo mientras minimiza los costos de inferencia. Este modelo está disponible de forma gratuita, ofreciendo una generosa ventana de contexto de 128K tokens y una salida máxima de 4K tokens. Sus pesos abiertos, datos de entrenamiento y recetas de ajuste fino se publican bajo una licencia abierta permisiva de NVIDIA, lo que garantiza una amplia accesibilidad. El despliegue es compatible con NeMo, NIM y los principales tiempos de ejecución de inferencia. Descubra sus capacidades para análisis y procesamiento de documentos hoy mismo en Multi AI.

MultimodalVisiónGratisIA Documental
75%Calidad
128KVentana de contexto
70%Velocidad
Categoría
Gratis
Acceso API
Contexto unificado
RAG + Knowledge Base
Soporte 24/7
Probar este modeloComparar modelos

Ideal para

Análisis
Documentos

🚀 Capacidades

Visión
Funciones
Streaming

Limitaciones

No genera imágenes

Especificaciones

Proveedornvidia
Ventana de contexto128,000 tokens
Salida máx4,096 tokens
Plan mínimoEconómico

Precios

Precio de entradaGratis / 1M tokens
Precio de salidaGratis / 1M tokens

💡 Con la suscripción PRO, el costo se reduce un 20%

¿Listo para probar NVIDIA: Nemotron Nano 12B 2 VL (free)?

Obtén 1,000 tokens gratis al registrarte

Comenzar gratis