Llama 3.2 3B

Meta Llama 3.2 系列 3B 小型语言模型，专为边缘和移动设备优化

参数量3B

模态Text

精度BF16

类型LLM

在 HuggingFace 查看

Jetson 部署命令模型详情

快速部署

部署模型

Jetson 设备

推理引擎

运行命令

命令根据你的配置自动生成

sudo docker run -it --rm --pull always \
--runtime=nvidia --network host \
-e VLLM_USE_MODELSCOPE=True \
-v ~/models:/models \
ghcr.io/nvidia-ai-iot/vllm:latest-jetson-orin vllm serve meta-llama/Llama-3.2-3B \
--port 8000 \
--max-model-len 4096 \
--gpu-memory-utilization 0.8

模型详情

发布者

输入和输出

输入: Text / 输出: Text

用途

边缘部署
通用推理

Jetson 兼容性

Thor 128GBThor 64GBOrin 64GBOrin 16GBOrin 8GB

模型路径

HF 镜像

https://hf-mirror.com/meta-llama/Llama-3.2-3B