A2
Économique

AllenAI: Molmo2 8B

par allenai

Molmo2-8B est un modèle vision-langage ouvert avancé développé par l'Allen Institute for AI (Ai2) en tant que partie clé de la famille Molmo2. Ce modèle est spécifiquement conçu pour prendre en charge une compréhension complète des images, des vidéos et des multi-images, ainsi que des capacités de mise à la terre robustes. Construit sur la puissante architecture Qwen3-8B et utilisant SigLIP 2 comme colonne vertébrale de vision, Molmo2-8B établit une nouvelle norme pour les modèles open-weight et open-data. Il surpasse considérablement ses concurrents dans les tâches impliquant des vidéos courtes, le comptage et le sous-titrage, tout en restant compétitif sur les tâches vidéo plus longues. Avec une fenêtre de contexte généreuse de 36K tokens et une sortie maximale de 36K tokens, il offre une capacité de traitement étendue. La tarification est compétitive à 0,20 $ par million de tokens d'entrée et 0,20 $ par million de tokens de sortie. Ce modèle est disponible sur un niveau d'accès GRATUIT, rendant les capacités avancées de vision IA accessibles à tous.

Modèle Vision-LangageAnalyse VidéoIA Open SourceCompréhension d'Images
46%Qualité
37KFenêtre de contexte
80%Vitesse
Catégorie
Économique
Accès API
Contexte unifié
RAG + Knowledge Base
Support 24/7
Essayer ce modèleComparer les modèles

Idéal pour

Analyse de vidéos courtes
Sous-titrage d'images
Compréhension multi-images
Comptage d'objets

🚀 Capacités

Streaming
Entrée vidéo
Vision

Spécifications

Fournisseurallenai
Fenêtre de contexte36,864 tokens
Sortie max36,864 tokens
Forfait minimumÉconomique

Tarifs

Prix d'entrée$0.2000 / 1M tokens
Prix de sortie$0.2000 / 1M tokens

💡 Avec l'abonnement PRO, le coût est réduit de 20%

Prêt à essayer AllenAI: Molmo2 8B ?

Obtenez 1 000 tokens gratuits à l'inscription

Commencer gratuitement