DeepSeek-V3.2-Exp es un modelo de lenguaje grande experimental lanzado por DeepSeek como un paso intermedio entre V3.1 y futuras arquitecturas. Introduce DeepSeek Sparse Attention (DSA), un mecanismo de atención dispersa de grano fino diseñado para mejorar la eficiencia del entrenamiento y la inferencia en escenarios de contexto largo, manteniendo la calidad de la salida. Los usuarios pueden controlar el comportamiento de razonamiento con el booleano `reasoning` `enabled`. Este modelo es ideal para explorar diseños de transformadores eficientes y la investigación avanzada de IA. El modelo fue entrenado bajo condiciones alineadas con V3.1-Terminus para permitir una comparación directa. Los puntos de referencia muestran un rendimiento aproximadamente a la par con V3.1 en tareas de razonamiento, codificación y uso de herramientas agenticas, con pequeñas compensaciones y ganancias dependiendo del dominio. Este lanzamiento se centra en validar optimizaciones arquitectónicas para longitudes de contexto extendidas en lugar de avanzar en la precisión bruta de las tareas, lo que lo convierte principalmente en un modelo orientado a la investigación para explorar diseños de transformadores eficientes. Las especificaciones clave incluyen una ventana de contexto sustancial de 163K tokens y una salida máxima de 4K tokens. Admite funciones, generación de código y streaming, destacando en tareas de código, razonamiento y matemáticas. El precio es competitivo a $0.21/$0.32 por 1M de tokens de entrada/salida. El acceso está disponible en el nivel STARTER.
✅ Ideal para
🚀 Capacidades
❌ Limitaciones
Especificaciones
| Proveedor | deepseek |
| Ventana de contexto | 163,840 tokens |
| Salida máx | 4,096 tokens |
| Plan mínimo | Equilibrio |
Precios
| Precio de entrada | $0.2100 / 1M tokens |
| Precio de salida | $0.3200 / 1M tokens |
💡 Con la suscripción PRO, el costo se reduce un 20%
¿Listo para probar DeepSeek: DeepSeek V3.2 Exp?
Obtén 1,000 tokens gratis al registrarte
Comenzar gratis