Qwen3-8B est un modèle linguistique causal dense de 8.2 milliards de paramètres de la série Qwen3, conçu à la fois pour les tâches de raisonnement exigeantes et le dialogue efficace. Il offre une capacité unique de basculer en toute transparence entre un mode «réflexion» pour les mathématiques, le codage et l'inférence logique, et un mode «non-réflexion» pour la conversation générale, ce qui le rend très adaptable. Ce modèle est finement réglé pour une exécution supérieure des instructions, l'intégration d'agents et l'écriture créative. Il offre un support multilingue robuste dans plus de 100 langues et dialectes, gère nativement une fenêtre de contexte de 32K tokens et peut s'étendre jusqu'à 131K tokens avec la mise à l'échelle YaRN. Les capacités incluent les fonctions, la génération de code et le streaming. Il est idéal pour le chat, le code et les tâches mathématiques. Les limitations incluent l'absence de génération d'images et d'accès à Internet. Le prix est de 0,05 $/0,25 $ par million de tokens (entrée/sortie), disponible en accès GRATUIT.
✅ Idéal pour
🚀 Capacités
❌ Limitations
Spécifications
| Fournisseur | qwen |
| Fenêtre de contexte | 128,000 tokens |
| Sortie max | 4,096 tokens |
| Forfait minimum | Économique |
Tarifs
| Prix d'entrée | $0.0500 / 1M tokens |
| Prix de sortie | $0.2500 / 1M tokens |
💡 Avec l'abonnement PRO, le coût est réduit de 20%