D1
经济

DeepSeek: R1 Distill Qwen 32B

来自 deepseek

DeepSeek R1 Distill Qwen 32B 代表了蒸馏大型语言模型领域的重大进步。该模型建立在 Qwen 2.5 32B 的坚实基础上,并利用 DeepSeek R1 的输出进行微调,提供了卓越的性能。它在多项基准测试中表现出优于 OpenAI 的 o1-mini 的能力,为密集模型创造了新的最先进记录。其竞争性能通过 AIME 2024 (72.6 pass@1)、MATH-500 (94.3 pass@1) 和 CodeForces 评级 1691 的出色得分进一步凸显。 该模型特别适用于需要高质量文本生成、复杂代码理解和高级数学问题解决的应用程序。凭借 64K tokens 的宽裕上下文窗口和 4K tokens 的最大输出,它能够处理大量输入并生成详细响应。定价极具竞争力,输入和输出每百万 tokens 均为 0.29 美元,使其成为开发人员和研究人员可访问且功能强大的工具。在 Multi AI 上免费访问此模型。

文本生成代码数学蒸馏LLM高性能
93%质量
33K上下文窗口
69%速度
分类
经济
API访问
统一上下文
RAG + Knowledge Base
24/7支持
试用此模型比较模型

最适合

聊天
代码生成
数学问题解决

🚀 能力

结构化输出
JSON模式
深度推理
代码生成
流式输出

限制

不支持图像生成
无互联网访问

规格

提供商deepseek
上下文窗口32,768 代币
最大输出32,768 代币
最低套餐经济

价格

输入价格$0.2900 / 1M 代币
输出价格$0.2900 / 1M 代币

💡 PRO订阅可享20%折扣

准备好试用 DeepSeek: R1 Distill Qwen 32B 了吗?

注册即可获得1,000个免费代币

免费开始