NVIDIA Llama 3.1 Nemotron 70B Instruct 是一款尖端语言模型,旨在生成异常精确和有用的回复。它基于强大的 Llama 3.1 70B 架构,并通过人类反馈强化学习 (RLHF) 进行了增强,在自动对齐基准测试中表现出卓越的性能。该模型专门为需要高准确性帮助性和回复生成的应用量身定制,适用于跨多个领域的各种用户查询。 该模型提供了一个高达 131K tokens 的上下文窗口,并能生成高达 4K tokens 的输出,支持复杂的交互和详细的回复。它包括函数调用和流式传输等高级功能,可实现动态和交互式 AI 应用。定价具有竞争力,输入令牌每百万 $1.20,输出令牌每百万 $1.20,可在 PRO 访问层级使用。此模型的使用受 Meta 的可接受使用政策约束。
80%质量
131K上下文窗口
67%速度
✅ 最适合
聊天
代码生成
创意写作
🚀 能力
函数调用
流式输出
❌ 限制
无图像生成
无互联网访问
规格
| 提供商 | nvidia |
| 上下文窗口 | 131,072 代币 |
| 最大输出 | 4,096 代币 |
| 最低套餐 | 高级 |
价格
| 输入价格 | $1.2000 / 1M 代币 |
| 输出价格 | $1.2000 / 1M 代币 |
💡 PRO订阅可享20%折扣