Q3
高级

Qwen: Qwen3 VL 32B Instruct

来自 qwen

Qwen3-VL-32B-Instruct 是一款尖端的大规模多模态视觉语言模型,经过精心设计,可在文本、图像和视频等多种数据类型上实现无与伦比的理解和推理。凭借令人印象深刻的320亿参数,该模型将深度视觉感知与先进的文本理解能力无缝结合。它在细粒度空间推理、全面的文档和场景分析以及长时序视频理解方面表现出色,使其成为复杂现实世界应用的理想选择。 该模型支持32种语言的强大OCR功能,并利用Interleaved-MRoPE和DeepStack架构等先进的多模态融合技术来增强性能。Qwen3-VL-32B 针对智能体交互和视觉工具使用进行了优化,为各种复杂的跨模态任务提供了最先进的性能。它提供了一个262K tokens的巨大上下文窗口,并以每1M tokens(输入/输出)0.50美元/1.50美元的竞争性价格在PRO访问层提供。

多模态视觉语言OCR视频分析
50%质量
262K上下文窗口
50%速度
分类
标准
API访问
统一上下文
RAG + Knowledge Base
24/7支持
试用此模型比较模型

最适合

空间推理
文档分析
视频理解
智能体交互

🚀 能力

流式输出
视觉能力
长上下文窗口

规格

提供商qwen
上下文窗口262,144 代币
最低套餐高级

价格

输入价格$0.5000 / 1M 代币
输出价格$1.5000 / 1M 代币

💡 PRO订阅可享20%折扣

准备好试用 Qwen: Qwen3 VL 32B Instruct 了吗?

注册即可获得1,000个免费代币

免费开始