Inception: Mercury 代表了大型语言模型领域的突破,是第一个采用离散扩散方法的模型。这种创新的架构使 Mercury 能够实现无与伦比的速度,比 GPT-4.1 Nano 和 Claude 3.5 Haiku 等高度优化的模型快 5-10 倍,同时保持可比的性能水平。 这种卓越的速度使 Mercury 成为开发人员创建高度响应式用户体验的理想选择。它在需要快速交互的应用程序中表现出色,包括语音代理、动态搜索界面和实时聊天机器人。凭借慷慨的 128K token 上下文窗口和 4K token 的最大输出,Mercury 支持复杂的对话和详细的响应。它提供函数、代码生成和流式传输等功能,使其适用于各种开发需求。定价具有竞争力,输入/输出每 1M token 0.25 美元/1.00 美元,可在 STARTER 访问层级使用。
70%质量
128K上下文窗口
70%速度
✅ 最适合
聊天机器人
语音代理
搜索界面
响应式UI
🚀 能力
函数
代码生成
流式传输
❌ 限制
无图像生成
规格
| 提供商 | inception |
| 上下文窗口 | 128,000 代币 |
| 最大输出 | 4,096 代币 |
| 最低套餐 | 平衡 |
价格
| 输入价格 | $0.2500 / 1M 代币 |
| 输出价格 | $1.0000 / 1M 代币 |
💡 PRO订阅可享20%折扣