Gemma 3n E4B-it está diseñado específicamente para un rendimiento eficiente en dispositivos móviles y de bajos recursos como teléfonos inteligentes, computadoras portátiles y tabletas. Este modelo versátil maneja entradas multimodales, incluyendo texto, datos visuales y audio, lo que permite una amplia gama de tareas como la generación de texto, el reconocimiento de voz, la traducción y el análisis de imágenes. Aprovecha técnicas avanzadas como el almacenamiento en caché Per-Layer Embedding (PLE) y la arquitectura MatFormer para gestionar dinámicamente el uso de la memoria y la carga computacional, reduciendo significativamente los requisitos de recursos en tiempo de ejecución. Este modelo cuenta con soporte para más de 140 idiomas y presenta una ventana de contexto flexible de 32K tokens. Gemma 3n puede cargar parámetros de forma selectiva, optimizando la memoria y la eficiencia computacional en función de la tarea o las capacidades del dispositivo. Esto lo convierte en una excelente opción para aplicaciones centradas en la privacidad, con capacidad sin conexión y soluciones de IA en el dispositivo. Accede a este potente modelo GRATIS en Multi AI. Soporta capacidades de streaming, tiene una ventana de contexto de 32K tokens y una salida máxima de 4K tokens. El precio es competitivo: $0.02/0.04 por 1M de tokens (entrada/salida). Ideal para aplicaciones de chat, pero ten en cuenta que no admite la generación de imágenes.
✅ Ideal para
🚀 Capacidades
❌ Limitaciones
Especificaciones
| Proveedor | |
| Ventana de contexto | 32,768 tokens |
| Salida máx | 4,096 tokens |
| Plan mínimo | Económico |
Precios
| Precio de entrada | $0.0200 / 1M tokens |
| Precio de salida | $0.0400 / 1M tokens |
💡 Con la suscripción PRO, el costo se reduce un 20%