Qwen3-VL-235B-A22B Instruct est un modèle multimodal open-source qui unifie une forte génération de texte avec la compréhension visuelle à travers les images et les vidéos. Le modèle Instruct cible l'utilisation générale de la vision-langage, y compris la réponse visuelle aux questions (VQA), l'analyse de documents, l'extraction de graphiques/tableaux et la reconnaissance optique de caractères (OCR) multilingue. La série met l'accent sur une perception robuste (reconnaissance de diverses catégories réelles et synthétiques), la compréhension spatiale (ancrage 2D/3D) et la compréhension visuelle à long terme, avec des résultats compétitifs sur les benchmarks multimodaux publics pour la perception et le raisonnement. Au-delà de l'analyse, Qwen3-VL prend en charge l'interaction agentique et l'utilisation d'outils : il peut suivre des instructions complexes sur des dialogues multi-images et multi-tours ; aligner du texte sur des chronologies vidéo pour des requêtes temporelles précises ; et opérer des éléments d'interface graphique pour des tâches d'automatisation. Les modèles permettent également des workflows de codage visuel — transformant des croquis ou des maquettes en code et aidant au débogage de l'interface utilisateur — tout en maintenant des performances textuelles fortes comparables aux modèles de langage Qwen3 phares. Cela rend Qwen3-VL adapté aux scénarios de production couvrant l'IA documentaire, l'OCR multilingue, l'assistance logicielle/UI, les tâches spatiales/incarnées et la recherche sur les agents vision-langage. Les spécifications clés incluent une fenêtre contextuelle de 262K tokens et une sortie maximale de 4K tokens. Il prend en charge les capacités de vision, de fonctions, de code et de streaming. La tarification est compétitive à 0,20 $/1,20 $ par million de tokens (entrée/sortie), disponible via le niveau d'accès PRO.
✅ Idéal pour
🚀 Capacités
❌ Limitations
Spécifications
| Fournisseur | qwen |
| Fenêtre de contexte | 262,144 tokens |
| Sortie max | 4,096 tokens |
| Forfait minimum | Premium |
Tarifs
| Prix d'entrée | $0.2000 / 1M tokens |
| Prix de sortie | $1.2000 / 1M tokens |
💡 Avec l'abonnement PRO, le coût est réduit de 20%
Prêt à essayer Qwen: Qwen3 VL 235B A22B Instruct ?
Obtenez 1 000 tokens gratuits à l'inscription
Commencer gratuitement