Molmo2-8B est un modèle vision-langage ouvert avancé développé par l'Allen Institute for AI (Ai2) en tant que partie clé de la famille Molmo2. Ce modèle est spécifiquement conçu pour prendre en charge une compréhension complète des images, des vidéos et des multi-images, ainsi que des capacités de mise à la terre robustes. Construit sur la puissante architecture Qwen3-8B et utilisant SigLIP 2 comme colonne vertébrale de vision, Molmo2-8B établit une nouvelle norme pour les modèles open-weight et open-data. Il surpasse considérablement ses concurrents dans les tâches impliquant des vidéos courtes, le comptage et le sous-titrage, tout en restant compétitif sur les tâches vidéo plus longues. Avec une fenêtre de contexte généreuse de 36K tokens et une sortie maximale de 36K tokens, il offre une capacité de traitement étendue. La tarification est compétitive à 0,20 $ par million de tokens d'entrée et 0,20 $ par million de tokens de sortie. Ce modèle est disponible sur un niveau d'accès GRATUIT, rendant les capacités avancées de vision IA accessibles à tous.
✅ Idéal pour
🚀 Capacités
Spécifications
| Fournisseur | allenai |
| Fenêtre de contexte | 36,864 tokens |
| Sortie max | 36,864 tokens |
| Forfait minimum | Économique |
Tarifs
| Prix d'entrée | $0.2000 / 1M tokens |
| Prix de sortie | $0.2000 / 1M tokens |
💡 Avec l'abonnement PRO, le coût est réduit de 20%
Prêt à essayer AllenAI: Molmo2 8B ?
Obtenez 1 000 tokens gratuits à l'inscription
Commencer gratuitement