Qwen2.5-VL-32B 是一款强大的多模态视觉语言模型,通过强化学习精心微调,可在复杂任务中提供卓越性能。它在数学推理、生成结构化输出和高精度解决视觉问题方面具有增强的能力。该模型特别擅长视觉分析,包括精确的物体识别、解释图像中嵌入的文本以及在扩展视频序列中定位事件。 Qwen2.5-VL-32B 展现了最先进的性能,在 MMMU、MathVista 和 VideoMME 等领先的多模态基准测试中始终名列前茅。除了其视觉能力外,它在 MMLU、数学问题解决和代码生成等传统文本任务中也保持着强大的推理和清晰度。凭借 16K token 的上下文窗口和 4K token 的最大输出,它为各种应用提供了强大的处理能力。立即在 Multi AI 免费使用此模型! Qwen2.5-VL-32B 的定价为每 1M 输入 token 0.05 美元,每 1M 输出 token 0.22 美元,使其成为开发人员和研究人员可访问且功能强大的工具。它支持视觉、代码和流媒体功能,非常适合聊天、代码开发和数学应用。请注意,它不支持图像生成或互联网访问。
77%质量
128K上下文窗口
69%速度
✅ 最适合
聊天
代码生成
数学推理
🚀 能力
长上下文
视觉
JSON模式
代码
流媒体
❌ 限制
不支持图像生成
无互联网访问
规格
| 提供商 | qwen |
| 上下文窗口 | 128,000 代币 |
| 最大输出 | 4,096 代币 |
| 最低套餐 | 平衡 |
价格
| 输入价格 | $0.2000 / 1M 代币 |
| 输出价格 | $0.6000 / 1M 代币 |
💡 PRO订阅可享20%折扣