Meituan: LongCat Flash Chat es un potente modelo Mixture-of-Experts (MoE) a gran escala, con un total de 560 mil millones de parámetros. Activa dinámicamente entre 18.6B y 31.3B parámetros por entrada, garantizando la eficiencia. Este modelo introduce un diseño MoE con conexiones de atajo para reducir la sobrecarga de comunicación y lograr un alto rendimiento, manteniendo la estabilidad del entrenamiento a través de estrategias de escalado avanzadas como la transferencia de hiperparámetros y la optimización multietapa. Optimizado como un modelo fundacional no pensante, LongCat-Flash-Chat está diseñado específicamente para tareas conversacionales y de agente. Ofrece un amplio soporte de ventana de contexto, manejando hasta 128K tokens, y ofrece un rendimiento competitivo en varios puntos de referencia, incluyendo razonamiento, codificación y seguimiento de instrucciones. Sus puntos fuertes particulares residen en el uso de herramientas y la gestión de interacciones complejas de varios pasos. Las especificaciones clave incluyen una ventana de contexto de 131K tokens y una salida máxima de 4K tokens. El precio se establece en $0.20 por 1 millón de tokens de entrada y $0.80 por 1 millón de tokens de salida, lo que lo convierte en un modelo de nivel STARTER accesible en Multi AI. Soporta capacidades de streaming.
✅ Ideal para
🚀 Capacidades
❌ Limitaciones
Especificaciones
| Proveedor | meituan |
| Ventana de contexto | 131,072 tokens |
| Salida máx | 32,768 tokens |
| Plan mínimo | Equilibrio |
Precios
| Precio de entrada | $0.2000 / 1M tokens |
| Precio de salida | $0.8000 / 1M tokens |
💡 Con la suscripción PRO, el costo se reduce un 20%
¿Listo para probar Meituan: LongCat Flash Chat?
Obtén 1,000 tokens gratis al registrarte
Comenzar gratis