Q3
经济

Qwen: Qwen3 VL 235B A22B Thinking

来自 qwen

Qwen3-VL-235B-A22B Thinking 是一款尖端的多模态模型,专为高级推理而设计,尤其是在STEM和数学领域。它无缝集成了强大的文本生成和复杂的视觉理解能力,能够处理图像和视频。该模型针对多模态推理进行了优化,在公共基准测试中展现出具有竞争力的感知和推理结果,包括对各种真实世界和合成类别的鲁棒识别、空间理解(2D/3D定位)以及长篇视觉理解。 除了分析任务,Qwen3-VL 还支持代理交互和工具使用。它可以在多图像、多轮对话中遵循复杂的指令;将文本与视频时间线对齐以进行精确的时间查询;并操作GUI元素以执行自动化任务。该模型还支持视觉编码工作流程,将草图或模型转换为代码,并协助UI调试,同时保持与旗舰Qwen3语言模型相当的强大纯文本性能。这使得Qwen3-VL 适用于文档AI、多语言OCR、软件/UI辅助、空间/具身任务以及视觉-语言代理研究等生产场景。 主要规格包括262K tokens的大上下文窗口和4K tokens的最大输出。它提供视觉、函数、代码和流式传输等功能。定价具有竞争力,输入每百万token $0.45,输出每百万token $3.50。可通过PRO级别访问。

多模态视觉-语言STEM推理代码
78%质量
131K上下文窗口
70%速度
分类
免费
API访问
统一上下文
RAG + Knowledge Base
24/7支持
试用此模型比较模型

最适合

聊天
代码生成
数学解题

🚀 能力

长上下文
视觉
结构化输出
JSON模式
函数
深度推理
代码
流式传输

限制

不支持图像生成
无互联网访问

规格

提供商qwen
上下文窗口131,072 代币
最大输出32,768 代币
最低套餐经济

价格

输入价格免费 / 1M 代币
输出价格免费 / 1M 代币

💡 PRO订阅可享20%折扣

准备好试用 Qwen: Qwen3 VL 235B A22B Thinking 了吗?

注册即可获得1,000个免费代币

免费开始