Baidu ERNIE 4.5 VL 424B A47B est un modèle multimodal Mixture-of-Experts (MoE) de pointe de la série ERNIE 4.5 de Baidu. Avec un total de 424 milliards de paramètres et 47 milliards actifs par token, il est entraîné conjointement sur des données textuelles et imagées en utilisant une architecture MoE hétérogène et un routage isolé par modalité. Cela permet un raisonnement intermodal exceptionnel, une compréhension détaillée des images et une génération de contexte long, supportant jusqu'à 131 000 tokens. Affûté avec des techniques avancées telles que SFT, DPO, UPO et RLVR, ERNIE 4.5 VL 424B A47B prend en charge les modes d'inférence « pensant » et non « pensant ». Il est spécifiquement conçu pour les tâches complexes de vision-langage en anglais et en chinois, offrant des performances optimisées et une mise à l'échelle efficace. Le modèle peut fonctionner sous quantification 4 bits/8 bits, ce qui le rend polyvalent pour diverses applications. Il a une fenêtre de contexte de 123K tokens et une sortie maximale de 4K tokens. Le prix est de 0,42 $ par million de tokens d'entrée et 1,25 $ par million de tokens de sortie, disponible au niveau d'accès STARTER. Les capacités clés incluent la vision et le streaming, ce qui le rend idéal pour l'analyse et le traitement de documents. Veuillez noter que ce modèle ne prend pas en charge la génération d'images.
✅ Idéal pour
🚀 Capacités
❌ Limitations
Spécifications
| Fournisseur | baidu |
| Fenêtre de contexte | 123,000 tokens |
| Sortie max | 16,000 tokens |
| Forfait minimum | Équilibre |
Tarifs
| Prix d'entrée | $0.4200 / 1M tokens |
| Prix de sortie | $1.2500 / 1M tokens |
💡 Avec l'abonnement PRO, le coût est réduit de 20%
Prêt à essayer Baidu: ERNIE 4.5 VL 424B A47B ?
Obtenez 1 000 tokens gratuits à l'inscription
Commencer gratuitement