Tongyi DeepResearch 30B A3B est un grand modèle linguistique agentique avancé développé par Tongyi Lab. Avec 30 milliards de paramètres au total, il n'active intelligemment que 3 milliards par jeton, ce qui le rend très efficace. Ce modèle est spécifiquement optimisé pour les tâches de recherche d'informations approfondies à long terme et excelle dans la recherche agentique complexe, le raisonnement et la résolution de problèmes en plusieurs étapes, surpassant les modèles précédents sur des benchmarks comme Humanity's Last Exam, BrowserComp et GAIA. Le modèle intègre un pipeline de données synthétiques entièrement automatisé pour le pré-entraînement, le réglage fin et l'apprentissage par renforcement évolutifs. Il dispose d'un pré-entraînement continu à grande échelle sur diverses données agentiques pour améliorer le raisonnement et rester à jour. L'apprentissage par renforcement de bout en bout basé sur la politique avec une optimisation de la politique relative de groupe personnalisée assure une formation stable. Il prend en charge ReAct pour les vérifications de capacités de base et un mode 'Heavy' basé sur IterResearch pour des performances maximales. Idéal pour les agents de recherche avancés et l'utilisation d'outils, il offre une fenêtre contextuelle de 131K jetons et une sortie maximale de 4K jetons. Le prix est compétitif à 0,09 $/0,40 $ par million de jetons (entrée/sortie).
✅ Idéal pour
🚀 Capacités
❌ Limitations
Spécifications
| Fournisseur | alibaba |
| Fenêtre de contexte | 131,072 tokens |
| Sortie max | 131,072 tokens |
| Forfait minimum | Équilibre |
Tarifs
| Prix d'entrée | $0.0900 / 1M tokens |
| Prix de sortie | $0.4500 / 1M tokens |
💡 Avec l'abonnement PRO, le coût est réduit de 20%
Prêt à essayer Tongyi DeepResearch 30B A3B ?
Obtenez 1 000 tokens gratuits à l'inscription
Commencer gratuitement