Qwen3-VL-30B-A3B-Instruct 是一款尖端的多模态 AI 模型,旨在将强大的文本生成与对图像和视频的复杂视觉理解相结合。此 Instruct 变体经过专门优化,可遵循各种通用多模态任务的指令,在真实世界和合成类别的感知、精确的 2D/3D 空间定位以及全面的长篇视觉理解方面表现出卓越的性能。它在领先的多模态基准测试中持续取得具有竞争力的结果。 除了其核心能力之外,Qwen3-VL-30B-A3B-Instruct 还非常适合代理应用。它能熟练处理多图像、多轮指令,促进视频时间轴对齐,支持 GUI 自动化,甚至可以从草图生成视觉编码到调试后的 UI。其文本性能与旗舰 Qwen3 模型相媲美,使其成为文档 AI、OCR、UI 辅助、空间任务和高级代理研究的理想选择。它拥有 131K 令牌的上下文窗口和 4K 令牌的最大输出,提供强大的处理能力。定价为每 1M 令牌(输入/输出)0.15 美元/0.60 美元,可在 STARTER 访问层级使用。
78%质量
131K上下文窗口
70%速度
✅ 最适合
聊天
代码生成
数学
🚀 能力
长上下文
视觉
结构化输出
JSON模式
函数
代码
流式传输
❌ 限制
不支持图像生成
无互联网访问
规格
| 提供商 | qwen |
| 上下文窗口 | 131,072 代币 |
| 最大输出 | 32,768 代币 |
| 最低套餐 | 平衡 |
价格
| 输入价格 | $0.1300 / 1M 代币 |
| 输出价格 | $0.5200 / 1M 代币 |
💡 PRO订阅可享20%折扣