DeepSeek-V3.1是一个大型混合推理模型,拥有6710亿参数(其中370亿为活跃参数),通过提示模板独特地支持“思维”和“非思维”模式。它以DeepSeek-V3为基础,通过两阶段长上下文训练过程增强了其能力,实现了高达128K tokens的惊人上下文窗口。为了实现高效推理,它采用了FP8微缩放技术。用户可以通过`reasoning` `enabled`布尔值精确控制模型的推理行为。 该模型显著改进了工具使用、代码生成和推理效率,在困难基准测试上实现了与DeepSeek-R1相当的性能,同时响应速度更快。它支持结构化工具调用、高级代码代理和复杂的搜索代理,使其成为研究、复杂编码任务和代理工作流程的绝佳选择。DeepSeek-V3.1是DeepSeek V3-0324模型的继任者,并在各种任务中表现出色。 主要规格包括8K tokens的上下文窗口(通过长上下文训练可达128K)、最大输出4K tokens,以及具有竞争力的价格:输入/输出每100万tokens分别为$0.15/$0.75。它提供函数、代码生成和流式传输等功能,使其成为各种AI应用的多功能工具。
79%质量
8K上下文窗口
70%速度
✅ 最适合
代码生成
复杂推理
数学问题
🚀 能力
函数
代码生成
流式传输
❌ 限制
无图像生成
无互联网访问
内容审查
规格
| 提供商 | deepseek |
| 上下文窗口 | 8,192 代币 |
| 最大输出 | 4,096 代币 |
| 最低套餐 | 平衡 |
价格
| 输入价格 | $0.1500 / 1M 代币 |
| 输出价格 | $0.7500 / 1M 代币 |
💡 PRO订阅可享20%折扣