百度 ERNIE 4.5 VL 424B A47B 是百度 ERNIE 4.5 系列中一款尖端的多模态 Mixture-of-Experts (MoE) 模型。它拥有 4240 亿总参数,每个 token 激活 470 亿参数,通过异构 MoE 架构和模态隔离路由,在文本和图像数据上联合训练。这使得它能够实现卓越的跨模态推理、详细的图像理解和长上下文生成,支持高达 131,000 个 token。 ERNIE 4.5 VL 424B A47B 采用 SFT、DPO、UPO 和 RLVR 等先进技术进行微调,支持“思考”和非“思考”两种推理模式。它专为英语和中文的复杂视觉-语言任务而设计,提供优化的性能和高效的扩展。该模型可以在 4 位/8 位量化下运行,使其适用于各种应用。它具有 123K token 的上下文窗口和 4K token 的最大输出。定价为每 100 万输入 token 0.42 美元,每 100 万输出 token 1.25 美元,可在 STARTER 访问层获得。 主要功能包括视觉和流式传输,使其成为分析和文档处理的理想选择。请注意,此模型不支持图像生成。
70%质量
123K上下文窗口
70%速度
✅ 最适合
分析
文档
🚀 能力
视觉
流式传输
❌ 限制
不支持图像生成
规格
| 提供商 | baidu |
| 上下文窗口 | 123,000 代币 |
| 最大输出 | 4,096 代币 |
| 最低套餐 | 平衡 |
价格
| 输入价格 | $0.4200 / 1M 代币 |
| 输出价格 | $1.2500 / 1M 代币 |
💡 PRO订阅可享20%折扣