DeepSeek-V3.2 是一款尖端的大型语言模型,旨在实现最佳计算效率和在推理及智能工具使用方面的卓越性能。它引入了 DeepSeek Sparse Attention (DSA),这是一种新颖的细粒度稀疏注意力机制,可显著降低训练和推理成本,同时在长上下文场景中保持高质量。该模型已展现出卓越的能力,在 2025 年 IMO 和 IOI 中获得金牌,将其推理能力定位在 GPT-5 级别。 为了进一步增强其效用,V3.2 采用了可扩展的强化学习后训练框架来改进推理,并引入了大规模的智能任务合成管道。该管道更好地将推理集成到工具使用设置中,提高了交互环境中的合规性和泛化能力。用户可以通过 `reasoning` `enabled` 布尔值控制推理行为。DeepSeek V3.2 具有 163K 令牌的上下文窗口和 4K 令牌的最大输出,定价为每 1M 输入/输出令牌 0.25 美元/0.38 美元,以其先进的功能提供了卓越的价值。
84%质量
164K上下文窗口
70%速度
✅ 最适合
代码生成
复杂推理
数学问题
🚀 能力
函数
代码
流式传输
❌ 限制
无图像生成
无互联网访问
内容审查
规格
| 提供商 | deepseek |
| 上下文窗口 | 163,840 代币 |
| 最大输出 | 4,096 代币 |
| 最低套餐 | 平衡 |
价格
| 输入价格 | $0.2500 / 1M 代币 |
| 输出价格 | $0.3800 / 1M 代币 |
💡 PRO订阅可享20%折扣