DeepSeek-V3.2-Exp est un grand modèle linguistique expérimental de DeepSeek, servant d'étape intermédiaire vers les architectures futures. Il introduit DeepSeek Sparse Attention (DSA), un nouveau mécanisme d'attention clairsemée à grain fin. DSA est conçu pour améliorer considérablement l'efficacité de l'entraînement et de l'inférence, en particulier dans les scénarios à long contexte, sans compromettre la qualité de la sortie. Les utilisateurs peuvent contrôler le comportement de raisonnement avec le booléen `reasoning` `enabled`. Ce modèle est idéal pour explorer des conceptions de transformateurs efficaces et la recherche avancée en IA. Développé dans des conditions alignées avec V3.1-Terminus, DeepSeek-V3.2-Exp permet des comparaisons de performances directes. Les benchmarks indiquent des performances généralement comparables à V3.1 dans des domaines critiques tels que le raisonnement, le codage et l'utilisation d'outils d'agent, avec des variations mineures. Son objectif principal est de valider les optimisations architecturales pour des longueurs de contexte étendues plutôt que la précision brute des tâches, ce qui en fait un outil précieux pour les chercheurs. Les spécifications clés incluent une fenêtre de contexte substantielle de 163K tokens et une sortie maximale de 4K tokens. Il prend en charge les fonctions, la génération de code et le streaming, excellant dans les tâches de code, de raisonnement et de mathématiques. Le prix est compétitif à 0,21 $/0,32 $ par million de tokens d'entrée/sortie. L'accès est disponible au niveau STARTER.
✅ Idéal pour
🚀 Capacités
❌ Limitations
Spécifications
| Fournisseur | deepseek |
| Fenêtre de contexte | 163,840 tokens |
| Sortie max | 4,096 tokens |
| Forfait minimum | Équilibre |
Tarifs
| Prix d'entrée | $0.2100 / 1M tokens |
| Prix de sortie | $0.3200 / 1M tokens |
💡 Avec l'abonnement PRO, le coût est réduit de 20%
Prêt à essayer DeepSeek: DeepSeek V3.2 Exp ?
Obtenez 1 000 tokens gratuits à l'inscription
Commencer gratuitement