Qwen3-VL-8B-Thinking est la variante optimisée pour le raisonnement du modèle multimodal Qwen3-VL-8B, spécialement conçue pour le raisonnement visuel et textuel avancé à travers des scènes complexes, des documents et des séquences temporelles. Il intègre un alignement multimodal amélioré et un traitement de contexte long (natif 256K, extensible à 1M de tokens) pour des tâches exigeantes telles que l'analyse visuelle scientifique, l'inférence causale et le raisonnement mathématique sur des entrées d'images ou de vidéos. Comparée à l'édition Instruct, la version Thinking introduit une fusion visuo-linguistique plus profonde et des chemins de raisonnement délibérés qui améliorent considérablement les performances sur les tâches de logique à longue chaîne, la résolution de problèmes STEM et la compréhension vidéo multi-étapes. Elle atteint une meilleure ancrage temporel via Interleaved-MRoPE et des embeddings sensibles aux horodatages, tout en maintenant une OCR robuste, une compréhension multilingue et une génération de texte au même niveau que les grands LLM textuels uniquement. Il prend en charge une fenêtre contextuelle de 256K tokens et une sortie maximale de 4K tokens. La tarification est de 0,18 $/2,10 $ par million de tokens (entrée/sortie) et il est disponible dans notre niveau d'accès PRO. Les capacités incluent la vision, les fonctions, le code et le streaming, ce qui le rend idéal pour le chat, la génération de code et la résolution de problèmes mathématiques complexes.
✅ Idéal pour
🚀 Capacités
❌ Limitations
Spécifications
| Fournisseur | qwen |
| Fenêtre de contexte | 256,000 tokens |
| Sortie max | 4,096 tokens |
| Forfait minimum | Premium |
Tarifs
| Prix d'entrée | $0.1800 / 1M tokens |
| Prix de sortie | $2.1000 / 1M tokens |
💡 Avec l'abonnement PRO, le coût est réduit de 20%
Prêt à essayer Qwen: Qwen3 VL 8B Thinking ?
Obtenez 1 000 tokens gratuits à l'inscription
Commencer gratuitement