Tongyi DeepResearch 30B A3B 是由通义实验室开发的一款先进的智能体大型语言模型。它拥有300亿总参数,但每个token智能地只激活30亿,使其效率极高。该模型专门针对长期、深度信息检索任务进行了优化,在复杂的智能体搜索、推理和多步骤问题解决方面表现出色,在Humanity's Last Exam、BrowserComp和GAIA等基准测试中超越了之前的模型。 该模型包含一个全自动的合成数据管道,用于可扩展的预训练、微调和强化学习。它利用大规模的持续预训练,在多样化的智能体数据上进行,以增强推理能力并保持时效性。端到端的策略内强化学习(RL)结合定制的Group Relative Policy Optimization,确保了稳定的训练。它支持ReAct进行核心能力检查,并提供基于IterResearch的“Heavy”模式,通过测试时扩展实现最大性能。它是高级研究智能体和工具使用的理想选择,提供131K token的上下文窗口和4K token的最大输出。定价具有竞争力,输入/输出每1M token分别为$0.09/$0.40。
67%质量
131K上下文窗口
70%速度
✅ 最适合
高级研究
复杂问题解决
信息检索
工具使用
🚀 能力
长上下文
结构化输出
JSON模式
函数
代码
搜索
流式传输
❌ 限制
无图像生成
规格
| 提供商 | alibaba |
| 上下文窗口 | 131,072 代币 |
| 最大输出 | 131,072 代币 |
| 最低套餐 | 平衡 |
价格
| 输入价格 | $0.0900 / 1M 代币 |
| 输出价格 | $0.4500 / 1M 代币 |
💡 PRO订阅可享20%折扣