Gemma 3 12B

Google Gemma 3 系列 12B 中型语言模型

参数量12B

模态Text

精度NVFP4 · BF16

类型LLM

在 HuggingFace 查看

Jetson 部署命令模型详情

快速部署

部署模型

Jetson 设备

推理引擎

运行命令

命令根据你的配置自动生成

sudo docker run -it --rm --pull always \
--runtime=nvidia --network host \
-e VLLM_USE_MODELSCOPE=True \
-v ~/models:/models \
ghcr.io/nvidia-ai-iot/vllm:latest-jetson-thor vllm serve google/gemma-3-12b \
--port 8000 \
--max-model-len 4096 \
--gpu-memory-utilization 0.85

模型详情

发布者

Google

系列

Gemma 3

参数量

12B

上下文长度

32,768 tokens

许可证

Apache 2.0

输入和输出

输入: Text / 输出: Text

用途

通用推理
代码生成

Jetson 兼容性

Thor 128GBThor 64GBOrin 64GBOrin 16GB

Gemma 3 系列

模型	参数量	硬件	精度
Gemma 3 12B	12B	Thor 128GB, Thor 64GB, Orin 64GB, Orin 16GB	NVFP4, BF16
Gemma 3 1B	1B	Thor 128GB, Thor 64GB, Orin 64GB, Orin 16GB, Orin 8GB	BF16
Gemma 3 4B	4B	Thor 128GB, Thor 64GB, Orin 64GB, Orin 16GB, Orin 8GB	BF16
Gemma 3 270M	270M	Thor 128GB, Thor 64GB, Orin 64GB, Orin 16GB, Orin 8GB	BF16
Gemma 3 27B	27B	Thor 128GB, Thor 64GB, Orin 64GB	NVFP4

模型路径

ModelScope

https://modelscope.cn/models/LLM-Research/gemma-3-12b