Equilibrio

DeepSeek: DeepSeek V3.2 Exp

Name: DeepSeek: DeepSeek V3.2 Exp
Brand: deepseek
Price: 270 USD
Rating: 4.0 (1 reviews)

DeepSeek-V3.2-Exp es un modelo de lenguaje grande experimental lanzado por DeepSeek como un paso intermedio entre V3.1 y futuras arquitecturas. Introduce DeepSeek Sparse Attention (DSA), un mecanismo de atención dispersa de grano fino diseñado para mejorar la eficiencia del entrenamiento y la inferencia en escenarios de contexto largo, manteniendo la calidad de la salida. Los usuarios pueden controlar el comportamiento de razonamiento con el booleano `reasoning` `enabled`. Este modelo es ideal para explorar diseños de transformadores eficientes y la investigación avanzada de IA. El modelo fue entrenado bajo condiciones alineadas con V3.1-Terminus para permitir una comparación directa. Los puntos de referencia muestran un rendimiento aproximadamente a la par con V3.1 en tareas de razonamiento, codificación y uso de herramientas agenticas, con pequeñas compensaciones y ganancias dependiendo del dominio. Este lanzamiento se centra en validar optimizaciones arquitectónicas para longitudes de contexto extendidas en lugar de avanzar en la precisión bruta de las tareas, lo que lo convierte principalmente en un modelo orientado a la investigación para explorar diseños de transformadores eficientes. Las especificaciones clave incluyen una ventana de contexto sustancial de 163K tokens y una salida máxima de 4K tokens. Admite funciones, generación de código y streaming, destacando en tareas de código, razonamiento y matemáticas. El precio es competitivo a $0.21/$0.32 por 1M de tokens de entrada/salida. El acceso está disponible en el nivel STARTER.

LLM ExperimentalAtención DispersaContexto LargoModelo de InvestigaciónIA para Código

81%Calidad

164KVentana de contexto

70%Velocidad

Categoría

Económico

✓Acceso API

✓Contexto unificado

✓RAG + Knowledge Base

✓Soporte 24/7

Probar este modelo Comparar modelos