DeepSeek R1 Distill Qwen 32B 代表了蒸馏大型语言模型领域的重大进步。该模型建立在 Qwen 2.5 32B 的坚实基础上,并利用 DeepSeek R1 的输出进行微调,提供了卓越的性能。它在多项基准测试中表现出优于 OpenAI 的 o1-mini 的能力,为密集模型创造了新的最先进记录。其竞争性能通过 AIME 2024 (72.6 pass@1)、MATH-500 (94.3 pass@1) 和 CodeForces 评级 1691 的出色得分进一步凸显。 该模型特别适用于需要高质量文本生成、复杂代码理解和高级数学问题解决的应用程序。凭借 64K tokens 的宽裕上下文窗口和 4K tokens 的最大输出,它能够处理大量输入并生成详细响应。定价极具竞争力,输入和输出每百万 tokens 均为 0.29 美元,使其成为开发人员和研究人员可访问且功能强大的工具。在 Multi AI 上免费访问此模型。
93%质量
33K上下文窗口
69%速度
✅ 最适合
聊天
代码生成
数学问题解决
🚀 能力
结构化输出
JSON模式
深度推理
代码生成
流式输出
❌ 限制
不支持图像生成
无互联网访问
规格
| 提供商 | deepseek |
| 上下文窗口 | 32,768 代币 |
| 最大输出 | 32,768 代币 |
| 最低套餐 | 经济 |
价格
| 输入价格 | $0.2900 / 1M 代币 |
| 输出价格 | $0.2900 / 1M 代币 |
💡 PRO订阅可享20%折扣