aoniAI Hub
返回模型列表

Gemma 4 E2B

Google Gemma 4 系列,5.1B 总参数 / 2.3B 有效参数,128K 上下文,支持文本、图像、音频

参数量5.1B-A2.3B
模态Text, Image, Audio
精度INT4
类型LLM

快速部署

部署模型

命令根据你的配置自动生成
sudo docker run -it --rm --pull always \
--runtime=nvidia --network host \
-v ~/models:/models \
ghcr.io/nvidia-ai-iot/llama_cpp:latest-jetson-orin \
-m /models/google/gemma-4-E2B-it \
-ngl 999 -c 4096 --port 8080

模型详情

发布者
Google
系列
Gemma 4
参数量
5.1B-A2.3B
上下文长度
131,072 tokens
许可证
Apache 2.0

输入和输出

输入: Text, Image, Audio / 输出: Text, Image, Audio

用途

  • 离线语音助手
  • 机器人协处理器
  • 轻量 OCR
  • 本地代理流水线

Jetson 兼容性

Thor 128GBThor 64GBOrin 64GBOrin 16GBOrin 8GB

标签

llmgooglemultimodalaudioedgesmall

Gemma 4 系列

模型参数量
Gemma 4 E2B5.1B-A2.3B
Gemma 4 E4B8B-A4.5B
Gemma 4 26B-A4B26B-A4B
Gemma 4 31B31B

模型路径