Qwen3-VL-8B-Thinking 是 Qwen3-VL-8B 多模态模型的推理优化变体,专门为跨复杂场景、文档和时间序列的高级视觉和文本推理而设计。它集成了增强的多模态对齐和长上下文处理(原生 256K,可扩展至 1M tokens),适用于科学视觉分析、因果推理以及图像或视频输入上的数学推理等要求苛刻的任务。 与 Instruct 版本相比,Thinking 版本引入了更深层次的视觉-语言融合和深思熟虑的推理路径,显著提高了在长链逻辑任务、STEM 问题解决和多步骤视频理解方面的性能。它通过 Interleaved-MRoPE 和时间戳感知嵌入实现了更强的时间定位,同时保持了与大型纯文本 LLM 相当的强大 OCR、多语言理解和文本生成能力。它支持 256K tokens 的上下文窗口和 4K tokens 的最大输出。定价为每 1M tokens(输入/输出)$0.18/$2.10,可在我们的 PRO 访问层级获取。 功能包括视觉、函数、代码和流式传输,使其成为聊天、代码生成和复杂数学问题解决的理想选择。
70%质量
131K上下文窗口
74%速度
✅ 最适合
聊天
代码生成
数学问题解决
🚀 能力
长上下文
视觉
结构化输出
JSON模式
函数
深度推理
代码
流式传输
❌ 限制
无法生成图像
无互联网访问
规格
| 提供商 | qwen |
| 上下文窗口 | 131,072 代币 |
| 最大输出 | 32,768 代币 |
| 最低套餐 | 高级 |
价格
| 输入价格 | $0.1170 / 1M 代币 |
| 输出价格 | $1.3650 / 1M 代币 |
💡 PRO订阅可享20%折扣