GLM-4.5-Air 是 Z.AI 最新旗舰模型系列的轻量级变体,专为以代理为中心的应用程序而构建。与 GLM-4.5 类似,它采用 Mixture-of-Experts (MoE) 架构,但参数规模更紧凑,使其能够高效处理各种任务。该模型在需要快速、响应式 AI 的场景中表现出色。 它支持混合推理模式,提供“思考模式”用于高级推理和工具使用,以及“非思考模式”用于实时交互。用户可以通过 `reasoning` `enabled` 布尔值控制推理行为。GLM-4.5-Air 的上下文窗口为 131K tokens,最大输出为 4K tokens,定价为每 1M tokens(输入/输出)$0.05/$0.22,可在 STARTER 访问层级使用。它支持函数、代码和流式传输功能。
67%质量
131K上下文窗口
70%速度
✅ 最适合
聊天
实时交互
推理
🚀 能力
函数
代码
流式传输
❌ 限制
不支持图像生成
规格
| 提供商 | z-ai |
| 上下文窗口 | 131,072 代币 |
| 最大输出 | 4,096 代币 |
| 最低套餐 | 平衡 |
价格
| 输入价格 | $0.0500 / 1M 代币 |
| 输出价格 | $0.2200 / 1M 代币 |
💡 PRO订阅可享20%折扣