Nous: Hermes 4 405B 是 Nous Research 开发的一款尖端大规模推理模型,利用了强大的 Meta-Llama-3.1-405B 架构。该模型引入了一种创新的混合推理模式,允许它通过 <think>...</think> 轨迹进行内部思考或直接响应,从而在速度和深度之间取得平衡。用户可以使用 `reasoning` `enabled` 布尔值精确控制此行为。它通过扩展的后训练语料库(约 600 亿个 token)进行指令微调,特别强调推理轨迹,以显著提高数学、编码、STEM 领域和一般逻辑推理的性能,同时保持作为助手的广泛实用性。 除了其推理能力,Hermes 4 还支持各种结构化输出,包括 JSON 模式、模式遵循、函数调用和工具使用,使其在集成到各种应用程序中具有高度通用性。该模型经过训练,具有增强的可控性、更低的拒绝率以及与中立、用户导向行为的对齐。凭借 131K token 的大上下文窗口和 4K token 的最大输出,它可以处理广泛的对话并生成详细的响应。定价具有竞争力,输入 token 每百万 $1.00,输出 token 每百万 $3.00,可在我们的 PRO 访问层级获取。其功能包括函数、代码生成、流式传输和搜索集成。
80%质量
131K上下文窗口
65%速度
✅ 最适合
聊天
复杂推理
代码辅助
逻辑问题解决
🚀 能力
函数
代码生成
流式传输
搜索
❌ 限制
不支持图像生成
规格
| 提供商 | nousresearch |
| 上下文窗口 | 131,072 代币 |
| 最大输出 | 4,096 代币 |
| 最低套餐 | 高级 |
价格
| 输入价格 | $1.0000 / 1M 代币 |
| 输出价格 | $3.0000 / 1M 代币 |
💡 PRO订阅可享20%折扣