Google Gemini 2.5 Flash Lite est un modèle de raisonnement léger et de pointe au sein de la célèbre famille Gemini 2.5. Conçu pour une vitesse et une rentabilité inégalées, ce modèle offre une latence ultra-faible et un débit considérablement amélioré. Il se distingue par une génération de jetons plus rapide et de meilleures performances sur les benchmarks courants par rapport aux modèles Flash précédents, ce qui en fait un excellent choix pour les applications où la vitesse est primordiale. Par défaut, sa fonction de 'réflexion' (raisonnement multi-pass) est désactivée pour privilégier la vitesse maximale. Cependant, les développeurs peuvent facilement activer ce raisonnement avancé via le [paramètre de l'API de raisonnement](https://openrouter.ai/docs/use-cases/reasoning-tokens) pour échanger sélectivement la vitesse contre des capacités analytiques plus profondes. Avec une fenêtre contextuelle généreuse de 1048K jetons et une sortie maximale de 8K jetons, Gemini 2.5 Flash Lite prend en charge le streaming, la vision, l'entrée audio, l'entrée vidéo, les fonctions et les sorties structurées. La tarification est très compétitive à 0,10 $/0,40 $ par million de jetons (entrée/sortie), ce qui le rend accessible pour un large éventail de projets. Idéal pour le chat, la génération de code, l'analyse de données et le traitement de documents, il est disponible sur le niveau d'accès STARTER de Multi AI.
✅ Idéal pour
🚀 Capacités
❌ Limitations
Spécifications
| Fournisseur | |
| Fenêtre de contexte | 1,048,576 tokens |
| Sortie max | 8,192 tokens |
| Forfait minimum | Équilibre |
Tarifs
| Prix d'entrée | $0.1000 / 1M tokens |
| Prix de sortie | $0.4000 / 1M tokens |
💡 Avec l'abonnement PRO, le coût est réduit de 20%
Prêt à essayer Google: Gemini 2.5 Flash Lite ?
Obtenez 1 000 tokens gratuits à l'inscription
Commencer gratuitement