Qwen3-VL-8B-Thinking 是 Qwen3-VL-8B 多模态模型的推理优化变体,专门为跨复杂场景、文档和时间序列的高级视觉和文本推理而设计。它集成了增强的多模态对齐和长上下文处理(原生 256K,可扩展至 1M tokens),适用于科学视觉分析、因果推理以及图像或视频输入上的数学推理等要求苛刻的任务。 与 Instruct 版本相比,Thinking 版本引入了更深层次的视觉-语言融合和深思熟虑的推理路径,显著提高了在长链逻辑任务、STEM 问题解决和多步骤视频理解方面的性能。它通过 Interleaved-MRoPE 和时间戳感知嵌入实现了更强的时间定位,同时保持了与大型纯文本 LLM 相当的强大 OCR、多语言理解和文本生成能力。它支持 256K tokens 的上下文窗口和 4K tokens 的最大输出。定价为每 1M tokens(输入/输出)$0.18/$2.10,可在我们的 PRO 访问层级获取。 功能包括视觉、函数、代码和流式传输,使其成为聊天、代码生成和复杂数学问题解决的理想选择。
70%质量
256K上下文窗口
74%速度
✅ 最适合
聊天
代码生成
数学问题解决
🚀 能力
视觉
函数
代码
流式传输
❌ 限制
无法生成图像
无互联网访问
规格
| 提供商 | qwen |
| 上下文窗口 | 256,000 代币 |
| 最大输出 | 4,096 代币 |
| 最低套餐 | 高级 |
价格
| 输入价格 | $0.1800 / 1M 代币 |
| 输出价格 | $2.1000 / 1M 代币 |
💡 PRO订阅可享20%折扣