Gemini 2.5 Flash-Lite 是 Gemini 2.5 系列中一款尖端的轻量级推理模型,专为超低延迟和卓越的成本效益而设计。与之前的 Flash 模型相比,该模型显著提高了吞吐量并加快了令牌生成速度,使其成为对速度要求极高的应用的理想选择。默认情况下,为优先考虑速度,已禁用“思考”(即多通道推理),但开发人员可以通过推理 API 参数启用它,从而有选择地权衡成本和智能。 这款强大的视觉模型拥有 1048K 令牌的上下文窗口和 4K 令牌的最大输出,为复杂任务提供了充足的容量。它支持广泛的功能,包括视觉、函数、代码和流式传输,使其适用于各种用例。定价极具竞争力,输入令牌每 1M 0.10 美元,输出令牌每 1M 0.40 美元,可通过 Multi AI 上的 STARTER 级别访问。它在聊天、代码生成、数据分析和文档处理等应用中表现出色。
70%质量
1049K上下文窗口
85%速度
✅ 最适合
聊天
代码
分析
文档
🚀 能力
长上下文
视觉
结构化输出
JSON模式
语音理解
函数
代码
流式传输
视频理解
❌ 限制
不支持图像生成
规格
| 提供商 | |
| 上下文窗口 | 1,048,576 代币 |
| 最大输出 | 65,535 代币 |
| 最低套餐 | 平衡 |
价格
| 输入价格 | $0.1000 / 1M 代币 |
| 输出价格 | $0.4000 / 1M 代币 |
💡 PRO订阅可享20%折扣