Qwen3-235B-A22B-Thinking-2507 是一款尖端的开源 Mixture-of-Experts (MoE) 语言模型,专为要求严苛的推理任务而设计。该变体在每次前向传递中激活其 235B 参数中的 22B,旨在增强结构化逻辑推理、数学、科学和长篇内容生成。它在 AIME、SuperGPQA、LiveCodeBench 和 MMLU-Redux 等基准测试中表现出色,并原生支持高达 262,144 个 token 的扩展上下文窗口。 这款“仅思考”变体强制执行特殊的推理模式 (</think>),并针对高 token 输出进行了优化,能够在具有挑战性的领域生成多达 81,920 个 token。它经过指令微调,使其在逐步推理、工具使用和代理工作流(包括多语言任务)方面非常有效。凭借 4K token 的最大输出和具有竞争力的价格(输入/输出每 1M token 分别为 $0.11/$0.60),它代表了 Qwen3-235B 系列中最强大的开源变体,在结构化推理用例中通常超越了许多封闭模型。
75%质量
262K上下文窗口
70%速度
✅ 最适合
聊天
代码生成
数学
🚀 能力
函数
代码
流式传输
❌ 限制
无图像生成
无互联网访问
规格
| 提供商 | qwen |
| 上下文窗口 | 262,144 代币 |
| 最大输出 | 4,096 代币 |
| 最低套餐 | 平衡 |
价格
| 输入价格 | $0.1100 / 1M 代币 |
| 输出价格 | $0.6000 / 1M 代币 |
💡 PRO订阅可享20%折扣