El modelo GPT-4o-audio-preview de OpenAI añade soporte robusto para entradas de audio como prompts. Esta mejora significativa permite al modelo procesar y comprender el lenguaje hablado con una precisión notable, detectando matices sutiles dentro de las grabaciones de audio. Esta capacidad añade una profundidad considerable a las experiencias de usuario generadas, haciéndolo ideal para aplicaciones que requieren un análisis e interpretación de audio sofisticados. Diseñado para acceso PRO, GPT-4o Audio cuenta con una ventana de contexto sustancial de 128K tokens y una salida máxima de 8K tokens. Soporta streaming, entrada de audio, funciones y salidas estructuradas. El precio es competitivo: $2.50 por millón de tokens de entrada y $10.00 por millón de tokens de salida. Aunque sobresale en la comprensión de audio, tenga en cuenta que las salidas de audio no son compatibles actualmente. Aproveche su poder para una transcripción superior y aplicaciones de IA impulsadas por audio en Multi AI.
✅ Ideal para
🚀 Capacidades
❌ Limitaciones
Especificaciones
| Proveedor | openai |
| Ventana de contexto | 128,000 tokens |
| Salida máx | 16,384 tokens |
| Plan mínimo | Premium |
Precios
| Precio de entrada | $2.5000 / 1M tokens |
| Precio de salida | $10.0000 / 1M tokens |
💡 Con la suscripción PRO, el costo se reduce un 20%