aoniAI Hub
返回模型列表

Gemma 3 1B

Google Gemma 3 系列 1B 轻量语言模型,适合资源受限设备

参数量1B
模态Text
精度BF16
类型LLM

快速部署

部署模型

命令根据你的配置自动生成
sudo docker run -it --rm --pull always \
--runtime=nvidia --network host \
-e VLLM_USE_MODELSCOPE=True \
-v ~/models:/models \
ghcr.io/nvidia-ai-iot/vllm:latest-jetson-orin vllm serve google/gemma-3-1b \
--port 8000 \
--max-model-len 4096 \
--gpu-memory-utilization 0.8

模型详情

发布者
Google
系列
Gemma 3
参数量
1B
上下文长度
32,768 tokens
许可证
Apache 2.0

输入和输出

输入: Text / 输出: Text

用途

  • 边缘部署
  • 轻量推理

Jetson 兼容性

Thor 128GBThor 64GBOrin 64GBOrin 16GBOrin 8GB

标签

llmgoogletinyedge

Gemma 3 系列

模型参数量
Gemma 3 1B1B
Gemma 3 4B4B
Gemma 3 12B12B
Gemma 3 270M270M
Gemma 3 27B27B

模型路径