Google 的 Gemma 3n E2B IT 是由 Google DeepMind 开发的多模态、指令调优模型。它旨在以 2B 的有效参数大小高效运行,同时利用 6B 架构。基于 MatFormer 架构,它支持嵌套子模型和通过 Mix-and-Match 框架进行模块化组合,使其具有高度适应性。 Gemma 3n 模型针对低资源部署进行了优化,提供 32K 的上下文长度(在 Multi AI 上有效为 8K),并在常见基准测试中展现出强大的多语言和推理性能。此版本在包含代码、数学、网络和多模态数据的多样化语料库上进行训练,使其适用于各种任务。它支持流式传输功能,实现动态交互。 在 Multi AI 上免费访问这款强大的模型。它最适合聊天应用,提供 8K 令牌的上下文窗口和 4K 令牌的最大输出。定价为每 1M 输入/输出令牌 0.00 美元,完全免费使用。
85%质量
8K上下文窗口
70%速度
✅ 最适合
聊天
多语言交流
推理
🚀 能力
流式传输
❌ 限制
无图像生成
规格
| 提供商 | |
| 上下文窗口 | 8,192 代币 |
| 最大输出 | 4,096 代币 |
| 最低套餐 | 经济 |
价格
| 输入价格 | 免费 / 1M 代币 |
| 输出价格 | 免费 / 1M 代币 |
💡 PRO订阅可享20%折扣