Z.AI: GLM 4.5V 是一个尖端的视觉-语言基础模型,专为高级多模态代理应用而设计。它建立在复杂的专家混合(MoE)架构之上,拥有1060亿参数,其中120亿参数处于激活状态,确保在广泛的任务中达到最先进的性能。该模型在视频理解、图像问答、光学字符识别(OCR)和文档解析方面取得了卓越的成果。此外,它在前端网页编码、基础理解和空间推理方面也取得了显著进展。 GLM-4.5V 提供独特的混合推理模式以优化性能。其“思考模式”非常适合深度推理和复杂问题解决,而“非思考模式”则为不那么密集的任务提供快速响应。用户可以通过 `reasoning` `enabled` 布尔值轻松切换推理行为。凭借慷慨的65K token上下文窗口和4K token的最大输出,它非常适合详细分析和文档处理。定价具有竞争力:输入每1M token $0.60,输出每1M token $1.80,可在我们的 PRO 访问层级获得。 主要功能包括视觉、函数调用、代码生成和流式传输。虽然功能非常多样,但目前不支持图像生成。在 Multi AI 上探索 GLM-4.5V 的强大功能,用于您的多模态 AI 项目。
70%质量
66K上下文窗口
70%速度
✅ 最适合
分析
文档处理
视频理解
网页编码
🚀 能力
视觉
函数
代码
流式传输
❌ 限制
不支持图像生成
规格
| 提供商 | z-ai |
| 上下文窗口 | 65,536 代币 |
| 最大输出 | 4,096 代币 |
| 最低套餐 | 高级 |
价格
| 输入价格 | $0.6000 / 1M 代币 |
| 输出价格 | $1.8000 / 1M 代币 |
💡 PRO订阅可享20%折扣