OpenAI: GPT Audio 是一款功能强大的 AI 模型,专注于各种音频处理应用。虽然未详细说明具体功能,但其设计表明侧重于高精度地理解、生成或操纵音频数据。该模型利用 OpenAI 尖端的 AI 研究,在音频相关任务中提供强大的性能。 凭借 128K token 的巨大上下文窗口,GPT Audio 可以处理复杂和冗长的音频输入,从而实现更细致和全面的处理。它通过 Multi AI 上的 PRO 访问层提供,输入 token 价格为每 1M token 2.50 美元,输出 token 价格为每 1M token 10.00 美元,适用于专业和高容量的使用场景。
128K上下文窗口
🚀 能力
长上下文
结构化输出
JSON模式
语音理解
语音合成
流式输出
规格
| 提供商 | openai |
| 上下文窗口 | 128,000 代币 |
| 最大输出 | 16,384 代币 |
| 最低套餐 | 高级 |
价格
| 输入价格 | $2.5000 / 1M 代币 |
| 输出价格 | $10.0000 / 1M 代币 |
💡 PRO订阅可享20%折扣