Gemma 3n E4B-it est spécifiquement conçu pour des performances efficaces sur les appareils mobiles et à faibles ressources tels que les smartphones, les ordinateurs portables et les tablettes. Ce modèle polyvalent gère les entrées multimodales, y compris le texte, les données visuelles et l'audio, permettant un large éventail de tâches telles que la génération de texte, la reconnaissance vocale, la traduction et l'analyse d'images. Il utilise des techniques avancées comme la mise en cache Per-Layer Embedding (PLE) et l'architecture MatFormer pour gérer dynamiquement la mémoire et la charge de calcul, réduisant considérablement les exigences en ressources d'exécution. Ce modèle prend en charge plus de 140 langues et dispose d'une fenêtre de contexte flexible de 32K tokens. Gemma 3n peut charger sélectivement des paramètres, optimisant la mémoire et l'efficacité de calcul en fonction de la tâche ou des capacités de l'appareil. Cela en fait un excellent choix pour les applications axées sur la confidentialité, capables de fonctionner hors ligne et les solutions d'IA sur l'appareil. Accédez GRATUITEMENT à ce puissant modèle sur Multi AI. Il prend en charge les capacités de streaming, dispose d'une fenêtre de contexte de 32K tokens et d'une sortie maximale de 4K tokens. La tarification est compétitive à 0,02 $/0,04 $ par 1M de tokens (entrée/sortie). Idéal pour les applications de chat, mais notez qu'il ne prend pas en charge la génération d'images.
✅ Idéal pour
🚀 Capacités
❌ Limitations
Spécifications
| Fournisseur | |
| Fenêtre de contexte | 32,768 tokens |
| Sortie max | 4,096 tokens |
| Forfait minimum | Économique |
Tarifs
| Prix d'entrée | $0.0200 / 1M tokens |
| Prix de sortie | $0.0400 / 1M tokens |
💡 Avec l'abonnement PRO, le coût est réduit de 20%
Prêt à essayer Google: Gemma 3n 4B ?
Obtenez 1 000 tokens gratuits à l'inscription
Commencer gratuitement