N1
Economy

NVIDIA: Nemotron Nano 12B 2 VL (free)

von nvidia

NVIDIA Nemotron Nano 2 VL ist ein leistungsstarkes, offenes multimodales Reasoning-Modell mit 12 Milliarden Parametern, das speziell für fortgeschrittenes Videoverständnis und umfassende Dokumentenintelligenz entwickelt wurde. Dieses Modell führt eine innovative hybride Transformer-Mamba-Architektur ein, die die Präzision von Transformatoren geschickt mit der speichereffizienten Sequenzmodellierung von Mamba kombiniert. Dies führt zu einem deutlich höheren Durchsatz und einer bemerkenswert geringeren Latenz, was es ideal für anspruchsvolle Anwendungen macht. Nemotron Nano 2 VL kann sowohl Text- als auch Multi-Image-Dokumente verarbeiten und generiert Ausgaben in natürlicher Sprache. Es wurde rigoros auf hochwertigen, von NVIDIA kuratierten synthetischen Datensätzen trainiert, die sorgfältig für die optische Zeichenerkennung (OCR), komplexe Diagramm-Reasoning und umfassende multimodale Komprehension optimiert wurden. Das Modell erzielt führende Ergebnisse bei OCRBench v2 und einen beeindruckenden Durchschnittswert von ≈ 74 über Benchmarks wie MMMU, MathVista, AI2D, OCRBench, OCR-Reasoning, ChartQA, DocVQA und Video-MME, wodurch es frühere offene VL-Baselines übertrifft. Mit Efficient Video Sampling (EVS) verarbeitet es effektiv Langform-Videos und minimiert gleichzeitig die Inferenzkosten. Dieses Modell ist kostenlos verfügbar und bietet ein großzügiges Kontextfenster von 128K Token und eine maximale Ausgabe von 4K Token. Seine offenen Gewichte, Trainingsdaten und Fine-Tuning-Rezepte werden unter einer permissiven NVIDIA Open License veröffentlicht, was eine breite Zugänglichkeit gewährleistet. Die Bereitstellung wird über NeMo, NIM und wichtige Inferenz-Laufzeiten unterstützt. Entdecken Sie seine Fähigkeiten für Analyse und Dokumentenverarbeitung noch heute auf Multi AI.

MultimodalVisionKostenlosDokumenten-KI
75%Qualität
128KKontextfenster
70%Geschwindigkeit
Kategorie
Kostenlos
API-Zugang
Einheitlicher Kontext
RAG + Knowledge Base
24/7 Support
Dieses Modell testenModelle vergleichen

Am besten für

Analyse
Dokumente

🚀 Fähigkeiten

Vision
Funktionen
Streaming

Einschränkungen

Keine Bilderzeugung

Spezifikationen

Anbieternvidia
Kontextfenster128,000 Token
Max. Ausgabe4,096 Token
MindestplanEconomy

Preise

EingabepreisKostenlos / 1M Token
AusgabepreisKostenlos / 1M Token

💡 Mit PRO-Abo werden die Kosten um 20% reduziert

Bereit, NVIDIA: Nemotron Nano 12B 2 VL (free) auszuprobieren?

Erhalten Sie 1.000 Token kostenlos bei der Anmeldung

Kostenlos starten