返回模型列表
发布者 Google 系列 Gemma 4 参数量 5.1B-A2.3B 上下文长度 131,072 tokens 许可证 Apache 2.0
Gemma 4 E2B
Google Gemma 4 系列,5.1B 总参数 / 2.3B 有效参数,128K 上下文,支持文本、图像、音频
参数量5.1B-A2.3B
模态Text, Image, Audio
精度INT4
类型LLM
快速部署
部署模型
命令根据你的配置自动生成
sudo docker run -it --rm --pull always \
--runtime=nvidia --network host \
-v ~/models:/models \
ghcr.io/nvidia-ai-iot/llama_cpp:latest-jetson-orin \
-m /models/google/gemma-4-E2B-it \
-ngl 999 -c 4096 --port 8080模型详情
输入和输出
输入: Text, Image, Audio / 输出: Text, Image, Audio
用途
- 离线语音助手
- 机器人协处理器
- 轻量 OCR
- 本地代理流水线
Jetson 兼容性
Thor 128GBThor 64GBOrin 64GBOrin 16GBOrin 8GB
标签
llmgooglemultimodalaudioedgesmall
Gemma 4 系列
| 模型 | 参数量 | 硬件 | 精度 |
|---|---|---|---|
| Gemma 4 E2B | 5.1B-A2.3B | Thor 128GB, Thor 64GB, Orin 64GB, Orin 16GB, Orin 8GB | INT4 |
| Gemma 4 E4B | 8B-A4.5B | Thor 128GB, Thor 64GB, Orin 64GB, Orin 16GB, Orin 8GB | INT4 |
| Gemma 4 26B-A4B | 26B-A4B | Thor 128GB, Thor 64GB, Orin 64GB, Orin 16GB, Orin 8GB | NVFP4, INT4 |
| Gemma 4 31B | 31B | Thor 128GB, Thor 64GB, Orin 64GB | NVFP4, INT4 |