平衡

Tongyi DeepResearch 30B A3B

Name: Tongyi DeepResearch 30B A3B
Brand: alibaba
Price: 90 USD
Rating: 3.4 (1 reviews)

Tongyi DeepResearch 30B A3B 是由通义实验室开发的一款先进的智能体大型语言模型。它拥有300亿总参数，但每个token智能地只激活30亿，使其效率极高。该模型专门针对长期、深度信息检索任务进行了优化，在复杂的智能体搜索、推理和多步骤问题解决方面表现出色，在Humanity's Last Exam、BrowserComp和GAIA等基准测试中超越了之前的模型。该模型包含一个全自动的合成数据管道，用于可扩展的预训练、微调和强化学习。它利用大规模的持续预训练，在多样化的智能体数据上进行，以增强推理能力并保持时效性。端到端的策略内强化学习（RL）结合定制的Group Relative Policy Optimization，确保了稳定的训练。它支持ReAct进行核心能力检查，并提供基于IterResearch的“Heavy”模式，通过测试时扩展实现最大性能。它是高级研究智能体和工具使用的理想选择，提供131K token的上下文窗口和4K token的最大输出。定价具有竞争力，输入/输出每1M token分别为$0.09/$0.40。

智能体AI深度搜索复杂推理研究助手

67%质量

131K上下文窗口

70%速度

分类

经济

✓API访问

✓统一上下文

✓RAG + Knowledge Base

✓24/7支持

试用此模型比较模型