DeepSeek R1 Distill Llama 70B 是一款先进的大型语言模型,它从 Llama-3.3-70B-Instruct 精心蒸馏而来,并利用 DeepSeek R1 的输出进行微调。这种创新方法使其在多项基准测试中取得了卓越的性能,包括 AIME 2024 pass@1: 70.0、MATH-500 pass@1: 94.5 和 CodeForces 评级:1633。 该模型专为效率和性能而设计,擅长需要强大推理能力、数学问题解决和代码生成的复杂任务。它支持 131K tokens 的宽泛上下文窗口,并可生成多达 4K tokens 的输出。其功能包括函数调用、代码解释和流式响应。 在 Multi AI 上免费访问 DeepSeek R1 Distill Llama 70B。定价极具竞争力,输入每百万 tokens 0.03 美元,输出每百万 tokens 0.11 美元,使其成为高性能、高性价比 AI 应用的理想选择。
94%质量
131K上下文窗口
67%速度
✅ 最适合
代码生成
复杂推理
数学问题
🚀 能力
长上下文
结构化输出
JSON模式
函数
深度推理
代码
流式传输
❌ 限制
无图像生成
无互联网访问
内容审查
规格
| 提供商 | deepseek |
| 上下文窗口 | 131,072 代币 |
| 最大输出 | 16,384 代币 |
| 最低套餐 | 平衡 |
价格
| 输入价格 | $0.7000 / 1M 代币 |
| 输出价格 | $0.8000 / 1M 代币 |
💡 PRO订阅可享20%折扣