Baidu ERNIE 4.5 VL 424B A47B ist ein hochmodernes multimodales Mixture-of-Experts (MoE)-Modell aus Baidus ERNIE 4.5-Serie. Mit insgesamt 424 Milliarden Parametern und 47 Milliarden aktiven pro Token wird es gemeinsam auf Text- und Bilddaten trainiert, wobei eine heterogene MoE-Architektur und modalitätsisolierte Routen verwendet werden. Dies ermöglicht eine außergewöhnliche kreuzmodale Argumentation, detailliertes Bildverständnis und Langkontext-Generierung, die bis zu 131.000 Token unterstützt. Feinabgestimmt mit fortschrittlichen Techniken wie SFT, DPO, UPO und RLVR unterstützt ERNIE 4.5 VL 424B A47B sowohl „denkende“ als auch nicht „denkende“ Inferenzmodi. Es wurde speziell für komplexe Vision-Sprach-Aufgaben in Englisch und Chinesisch entwickelt und bietet optimierte Leistung und effiziente Skalierung. Das Modell kann unter 4-Bit/8-Bit-Quantisierung betrieben werden, was es vielseitig für verschiedene Anwendungen macht. Es hat ein Kontextfenster von 123K Token und eine maximale Ausgabe von 4K Token. Die Preise betragen 0,42 $ pro 1 Million Eingabetoken und 1,25 $ pro 1 Million Ausgabetoken, verfügbar im STARTER-Zugangsbereich. Zu den Hauptfunktionen gehören Vision und Streaming, wodurch es ideal für Analyse- und Dokumentenverarbeitung ist. Bitte beachten Sie, dass dieses Modell keine Bilder generieren kann.
✅ Am besten für
🚀 Fähigkeiten
❌ Einschränkungen
Spezifikationen
| Anbieter | baidu |
| Kontextfenster | 123,000 Token |
| Max. Ausgabe | 4,096 Token |
| Mindestplan | Balance |
Preise
| Eingabepreis | $0.4200 / 1M Token |
| Ausgabepreis | $1.2500 / 1M Token |
💡 Mit PRO-Abo werden die Kosten um 20% reduziert
Bereit, Baidu: ERNIE 4.5 VL 424B A47B auszuprobieren?
Erhalten Sie 1.000 Token kostenlos bei der Anmeldung
Kostenlos starten