Qwen3-VL-30B-A3B-Instruct est un modèle d'IA multimodal de pointe conçu pour unifier une génération de texte robuste avec une compréhension visuelle sophistiquée à travers les images et les vidéos. Cette variante Instruct est spécifiquement optimisée pour suivre les instructions dans un large éventail de tâches multimodales générales, démontrant des performances exceptionnelles dans la perception des catégories réelles et synthétiques, un ancrage spatial 2D/3D précis et une compréhension visuelle longue et complète. Il obtient constamment des résultats compétitifs sur les principaux benchmarks multimodaux. Au-delà de ses capacités fondamentales, Qwen3-VL-30B-A3B-Instruct est très adapté aux applications d'agents. Il gère habilement les instructions multi-images et multi-tours, facilite les alignements de chronologie vidéo, prend en charge l'automatisation de l'interface graphique et peut même générer du codage visuel, des croquis à l'interface utilisateur déboguée. Ses performances textuelles rivalisent avec les modèles phares de Qwen3, ce qui le rend idéal pour l'IA documentaire, l'OCR, l'assistance UI, les tâches spatiales et la recherche avancée d'agents. Avec une fenêtre contextuelle de 131K jetons et une sortie maximale de 4K jetons, il offre une puissance de traitement étendue. Le prix est de 0,15 $/0,60 $ par million de jetons (entrée/sortie) et il est disponible dans le niveau d'accès STARTER.
✅ Idéal pour
🚀 Capacités
❌ Limitations
Spécifications
| Fournisseur | qwen |
| Fenêtre de contexte | 131,072 tokens |
| Sortie max | 32,768 tokens |
| Forfait minimum | Équilibre |
Tarifs
| Prix d'entrée | $0.1300 / 1M tokens |
| Prix de sortie | $0.5200 / 1M tokens |
💡 Avec l'abonnement PRO, le coût est réduit de 20%
Prêt à essayer Qwen: Qwen3 VL 30B A3B Instruct ?
Obtenez 1 000 tokens gratuits à l'inscription
Commencer gratuitement