Meituan: LongCat Flash Chat est un puissant modèle Mixture-of-Experts (MoE) à grande échelle, doté de 560 milliards de paramètres au total. Il active dynamiquement 18.6B–31.3B paramètres par entrée, garantissant l'efficacité. Ce modèle introduit une conception MoE à connexion raccourcie pour réduire la surcharge de communication et atteindre un débit élevé tout en maintenant la stabilité de l'entraînement grâce à des stratégies de mise à l'échelle avancées telles que le transfert d'hyperparamètres et l'optimisation multi-étapes. Optimisé en tant que modèle de fondation non pensant, LongCat-Flash-Chat est spécifiquement conçu pour les tâches conversationnelles et d'agent. Il offre un support étendu de la fenêtre de contexte, gérant jusqu'à 128K tokens, et offre des performances compétitives sur divers benchmarks, y compris le raisonnement, le codage et le suivi des instructions. Ses points forts particuliers résident dans l'utilisation d'outils et la gestion d'interactions complexes en plusieurs étapes. Les spécifications clés incluent une fenêtre de contexte de 131K tokens et une sortie maximale de 4K tokens. Le prix est fixé à 0,20 $ par million de tokens d'entrée et 0,80 $ par million de tokens de sortie, ce qui en fait un modèle de niveau STARTER accessible sur Multi AI. Il prend en charge les capacités de streaming.
✅ Idéal pour
🚀 Capacités
❌ Limitations
Spécifications
| Fournisseur | meituan |
| Fenêtre de contexte | 131,072 tokens |
| Sortie max | 4,096 tokens |
| Forfait minimum | Équilibre |
Tarifs
| Prix d'entrée | $0.2000 / 1M tokens |
| Prix de sortie | $0.8000 / 1M tokens |
💡 Avec l'abonnement PRO, le coût est réduit de 20%
Prêt à essayer Meituan: LongCat Flash Chat ?
Obtenez 1 000 tokens gratuits à l'inscription
Commencer gratuitement