Die InternVL3-Serie, insbesondere die 78B-Variante, stellt ein fortschrittliches multimodales großes Sprachmodell (MLLM) dar, das von OpenGVLab entwickelt wurde. Dieses Modell verbessert die multimodalen Wahrnehmungs- und Argumentationsfähigkeiten im Vergleich zu seinem Vorgänger InternVL 2.5 erheblich. Es wurde entwickelt, um komplexe Aufgaben zu bewältigen, die ein tiefes Verständnis verschiedener Datentypen erfordern. InternVL3 78B wird mit den Qwen2.5 Chat-Modellen verglichen, wobei deren vortrainierte Basismodelle für die Sprachkomponente verwendet werden. Dank des nativen multimodalen Vortrainings übertrifft die InternVL3-Serie die Qwen2.5-Serie in der gesamten Textleistung. Sie unterstützt ein Kontextfenster von 32K Token und eine maximale Ausgabe von 4K Token. Zu den Fähigkeiten gehören Vision, Code und Streaming. Die Preise liegen bei 0,10 $ pro 1 Mio. Eingabetoken und 0,39 $ pro 1 Mio. Ausgabetoken, verfügbar über den STARTER-Zugang. Es eignet sich am besten für Analysen und Dokumente, unterstützt jedoch keine Bildgenerierung.
✅ Am besten für
🚀 Fähigkeiten
❌ Einschränkungen
Spezifikationen
| Anbieter | opengvlab |
| Kontextfenster | 32,768 Token |
| Max. Ausgabe | 32,768 Token |
| Mindestplan | Balance |
Preise
| Eingabepreis | $0.1500 / 1M Token |
| Ausgabepreis | $0.6000 / 1M Token |
💡 Mit PRO-Abo werden die Kosten um 20% reduziert
Bereit, OpenGVLab: InternVL3 78B auszuprobieren?
Erhalten Sie 1.000 Token kostenlos bei der Anmeldung
Kostenlos starten