Gemini 2.5 Flash-Lite es un modelo de razonamiento ligero de vanguardia dentro de la familia Gemini 2.5, diseñado específicamente para una latencia ultrabaja y una eficiencia de costos excepcional. Este modelo mejora significativamente el rendimiento y ofrece una generación de tokens más rápida en comparación con sus predecesores, lo que lo convierte en una opción principal para aplicaciones donde la velocidad es primordial. Si bien el 'pensamiento' (razonamiento de múltiples pasadas) está deshabilitado por defecto para maximizar la velocidad, los desarrolladores tienen la flexibilidad de habilitarlo a través del parámetro de la API de razonamiento, lo que permite un equilibrio estratégico entre costo e inteligencia. Este potente modelo de visión cuenta con una ventana de contexto sustancial de 1048K tokens y una salida máxima de 4K tokens, lo que proporciona una amplia capacidad para tareas complejas. Admite una amplia gama de capacidades que incluyen visión, funciones, código y streaming, lo que lo hace versátil para varios casos de uso. El precio es altamente competitivo: $0.10 por 1M de tokens de entrada y $0.40 por 1M de tokens de salida, accesible a través del nivel STARTER en Multi AI. Destaca en aplicaciones como chat, generación de código, análisis de datos y procesamiento de documentos.
✅ Ideal para
🚀 Capacidades
❌ Limitaciones
Especificaciones
| Proveedor | |
| Ventana de contexto | 1,048,576 tokens |
| Salida máx | 4,096 tokens |
| Plan mínimo | Equilibrio |
Precios
| Precio de entrada | $0.1000 / 1M tokens |
| Precio de salida | $0.4000 / 1M tokens |
💡 Con la suscripción PRO, el costo se reduce un 20%
¿Listo para probar Google: Gemini 2.5 Flash Lite Preview 09-2025?
Obtén 1,000 tokens gratis al registrarte
Comenzar gratis