Tongyi DeepResearch 30B A3B es un modelo de lenguaje grande agéntico avanzado desarrollado por Tongyi Lab. Con 30 mil millones de parámetros totales, activa inteligentemente solo 3 mil millones por token, lo que lo hace muy eficiente. Este modelo está específicamente optimizado para tareas de búsqueda de información profunda a largo plazo y sobresale en la búsqueda agéntica compleja, el razonamiento y la resolución de problemas en múltiples pasos, superando a modelos anteriores en benchmarks como Humanity's Last Exam, BrowserComp y GAIA. El modelo incluye una tubería de datos sintéticos totalmente automatizada para el preentrenamiento, el ajuste fino y el aprendizaje por refuerzo escalables. Cuenta con un preentrenamiento continuo a gran escala en diversos datos agénticos para mejorar el razonamiento y mantenerse actualizado. El RL de política en línea de extremo a extremo con una optimización de política relativa de grupo personalizada garantiza un entrenamiento estable. Admite ReAct para verificaciones de habilidades básicas y un modo 'Heavy' basado en IterResearch para un rendimiento máximo. Ideal para agentes de investigación avanzados y el uso de herramientas, ofrece una ventana de contexto de 131K tokens y una salida máxima de 4K tokens. El precio es competitivo a $0.09/0.40 por 1M de tokens (entrada/salida).
✅ Ideal para
🚀 Capacidades
❌ Limitaciones
Especificaciones
| Proveedor | alibaba |
| Ventana de contexto | 131,072 tokens |
| Salida máx | 131,072 tokens |
| Plan mínimo | Equilibrio |
Precios
| Precio de entrada | $0.0900 / 1M tokens |
| Precio de salida | $0.4500 / 1M tokens |
💡 Con la suscripción PRO, el costo se reduce un 20%
¿Listo para probar Tongyi DeepResearch 30B A3B?
Obtén 1,000 tokens gratis al registrarte
Comenzar gratis