DeepSeek-V3.2-Exp — это экспериментальная большая языковая модель от DeepSeek, служащая промежуточным шагом к будущим архитектурам. Она представляет DeepSeek Sparse Attention (DSA), новый механизм разреженного внимания с мелкой детализацией. DSA разработан для значительного повышения эффективности обучения и вывода, особенно в сценариях с длинным контекстом, без ущерба для качества вывода. Пользователи могут точно настраивать поведение рассуждения с помощью логического параметра `reasoning` `enabled`. Эта модель идеально подходит для изучения эффективных конструкций трансформеров и передовых исследований в области ИИ. Разработанная в условиях, соответствующих V3.1-Terminus, DeepSeek-V3.2-Exp позволяет проводить прямое сравнение производительности. Бенчмаркинг показывает производительность, в целом сопоставимую с V3.1 в таких критически важных областях, как рассуждение, кодирование и использование агентных инструментов, с незначительными вариациями. Ее основное внимание уделяется проверке архитектурных оптимизаций для расширенной длины контекста, а не сырой точности задач, что делает ее ценным инструментом для исследователей. Ключевые характеристики включают существенное окно контекста в 163K токенов и максимальный вывод в 4K токенов. Она поддерживает функции, генерацию кода и потоковую передачу, превосходно справляясь с задачами кодирования, рассуждения и математики. Ценообразование конкурентоспособно: $0.21/$0.32 за 1M входных/выходных токенов. Доступ предоставляется на уровне STARTER.
✅ Лучше всего для
🚀 Возможности
❌ Ограничения
Характеристики
| Провайдер | deepseek |
| Окно контекста | 163,840 токенов |
| Максимальный вывод | 4,096 токенов |
| Минимальный тариф | Баланс |
Цены
| Цена ввода | $0.2100 / 1M токенов |
| Цена вывода | $0.3200 / 1M токенов |
💡 С подпиской PRO стоимость снижается на 20%
Готовы попробовать DeepSeek: DeepSeek V3.2 Exp?
Получите 1,000 токенов бесплатно при регистрации
Начать бесплатно