Équilibre

DeepSeek: DeepSeek V3.2 Exp

Name: DeepSeek: DeepSeek V3.2 Exp
Brand: deepseek
Price: 270 USD
Rating: 4.0 (1 reviews)

DeepSeek-V3.2-Exp est un grand modèle linguistique expérimental de DeepSeek, servant d'étape intermédiaire vers les architectures futures. Il introduit DeepSeek Sparse Attention (DSA), un nouveau mécanisme d'attention clairsemée à grain fin. DSA est conçu pour améliorer considérablement l'efficacité de l'entraînement et de l'inférence, en particulier dans les scénarios à long contexte, sans compromettre la qualité de la sortie. Les utilisateurs peuvent contrôler le comportement de raisonnement avec le booléen `reasoning` `enabled`. Ce modèle est idéal pour explorer des conceptions de transformateurs efficaces et la recherche avancée en IA. Développé dans des conditions alignées avec V3.1-Terminus, DeepSeek-V3.2-Exp permet des comparaisons de performances directes. Les benchmarks indiquent des performances généralement comparables à V3.1 dans des domaines critiques tels que le raisonnement, le codage et l'utilisation d'outils d'agent, avec des variations mineures. Son objectif principal est de valider les optimisations architecturales pour des longueurs de contexte étendues plutôt que la précision brute des tâches, ce qui en fait un outil précieux pour les chercheurs. Les spécifications clés incluent une fenêtre de contexte substantielle de 163K tokens et une sortie maximale de 4K tokens. Il prend en charge les fonctions, la génération de code et le streaming, excellant dans les tâches de code, de raisonnement et de mathématiques. Le prix est compétitif à 0,21 $/0,32 $ par million de tokens d'entrée/sortie. L'accès est disponible au niveau STARTER.

LLM ExpérimentalAttention ÉparseContexte LongModèle de RechercheIA de Code

81%Qualité

164KFenêtre de contexte

70%Vitesse

Catégorie

Économique

✓Accès API

✓Contexte unifié

✓RAG + Knowledge Base

✓Support 24/7

Essayer ce modèle Comparer les modèles