Gemini 2.5 Flash-Lite est un modèle de raisonnement léger de pointe au sein de la famille Gemini 2.5, spécialement conçu pour une latence ultra-faible et une efficacité économique exceptionnelle. Ce modèle améliore considérablement le débit et offre une génération de jetons plus rapide par rapport à ses prédécesseurs, ce qui en fait un choix de premier ordre pour les applications où la vitesse est primordiale. Bien que la « réflexion » (raisonnement multi-pass) soit désactivée par défaut pour maximiser la vitesse, les développeurs ont la flexibilité de l'activer via le paramètre de l'API de raisonnement, permettant un compromis stratégique entre le coût et l'intelligence. Ce puissant modèle de vision dispose d'une fenêtre contextuelle substantielle de 1048K jetons et d'une sortie maximale de 4K jetons, offrant une capacité suffisante pour les tâches complexes. Il prend en charge un large éventail de capacités, notamment la vision, les fonctions, le code et le streaming, ce qui le rend polyvalent pour divers cas d'utilisation. La tarification est très compétitive à 0,10 $ par million de jetons d'entrée et 0,40 $ par million de jetons de sortie, accessible via le niveau STARTER sur Multi AI. Il excelle dans des applications telles que le chat, la génération de code, l'analyse de données et le traitement de documents.
✅ Idéal pour
🚀 Capacités
❌ Limitations
Spécifications
| Fournisseur | |
| Fenêtre de contexte | 1,048,576 tokens |
| Sortie max | 4,096 tokens |
| Forfait minimum | Équilibre |
Tarifs
| Prix d'entrée | $0.1000 / 1M tokens |
| Prix de sortie | $0.4000 / 1M tokens |
💡 Avec l'abonnement PRO, le coût est réduit de 20%
Prêt à essayer Google: Gemini 2.5 Flash Lite Preview 09-2025 ?
Obtenez 1 000 tokens gratuits à l'inscription
Commencer gratuitement