Hunyuan-A13B Instruct de Tencent est un puissant modèle linguistique Mixture-of-Experts (MoE) de 13B paramètres actifs, affichant un nombre total impressionnant de 80B paramètres. Conçu pour les applications avancées, il prend en charge un raisonnement sophistiqué via Chain-of-Thought, le rendant très efficace pour la résolution de problèmes complexes. Ce modèle démontre des performances de référence compétitives dans un large éventail de domaines, y compris les mathématiques, les sciences, le codage et les tâches de raisonnement multi-tours. Il atteint une efficacité d'inférence élevée grâce à Grouped Query Attention (GQA) et prend en charge diverses méthodes de quantification comme FP8 et GPTQ. Avec une fenêtre contextuelle généreuse de 131K tokens et une sortie maximale de 4K tokens, il est idéal pour les tâches conversationnelles et génératives étendues. Le prix est fixé à 0,14 $ par million de tokens d'entrée et 0,57 $ par million de tokens de sortie, disponible au niveau d'accès STARTER. Il prend en charge la génération de code et les capacités de streaming.
✅ Idéal pour
🚀 Capacités
❌ Limitations
Spécifications
| Fournisseur | tencent |
| Fenêtre de contexte | 131,072 tokens |
| Sortie max | 131,072 tokens |
| Forfait minimum | Équilibre |
Tarifs
| Prix d'entrée | $0.1400 / 1M tokens |
| Prix de sortie | $0.5700 / 1M tokens |
💡 Avec l'abonnement PRO, le coût est réduit de 20%
Prêt à essayer Tencent: Hunyuan A13B Instruct ?
Obtenez 1 000 tokens gratuits à l'inscription
Commencer gratuitement