Google Gemini 2.5 Flash Lite 是 Gemini 2.5 系列中一款尖端、轻量级的推理模型。该模型专为无与伦比的速度和成本效益而设计,提供超低延迟和显著提高的吞吐量。与早期的 Flash 模型相比,它拥有更快的令牌生成速度和在常见基准测试中更优异的性能,使其成为速度至关重要的应用的绝佳选择。 默认情况下,其“思考”(即多通道推理)功能被禁用,以优先考虑最大速度。但是,开发人员可以通过 [推理 API 参数](https://openrouter.ai/docs/use-cases/reasoning-tokens) 轻松启用此高级推理,以选择性地权衡速度和更深层次的分析能力。凭借慷慨的 1048K 令牌上下文窗口和 8K 令牌的最大输出,Gemini 2.5 Flash Lite 支持流式传输、视觉、音频输入、视频输入、函数和结构化输出。定价极具竞争力,输入/输出每 1M 令牌分别为 $0.10/$0.40,使其适用于广泛的项目。它最适合聊天、代码生成、数据分析和文档处理,可在 Multi AI 的 STARTER 访问层级使用。
72%质量
1049K上下文窗口
85%速度
✅ 最适合
聊天
代码生成
数据分析
文档处理
🚀 能力
流式传输
视觉
音频输入
视频输入
函数
结构化输出
❌ 限制
不支持图像生成
规格
| 提供商 | |
| 上下文窗口 | 1,048,576 代币 |
| 最大输出 | 8,192 代币 |
| 最低套餐 | 平衡 |
价格
| 输入价格 | $0.1000 / 1M 代币 |
| 输出价格 | $0.4000 / 1M 代币 |
💡 PRO订阅可享20%折扣