Llama 3.1 8B

Meta Llama 3.1 系列 8B 通用语言模型，多语言支持和强大的指令遵循能力

参数量8B

模态Text

精度NVFP4 · BF16

类型LLM

在 HuggingFace 查看

Jetson 部署命令模型详情

快速部署

部署模型

Jetson 设备

推理引擎

运行命令

命令根据你的配置自动生成

sudo docker run -it --rm --pull always \
--runtime=nvidia --network host \
-e VLLM_USE_MODELSCOPE=True \
-v ~/models:/models \
ghcr.io/nvidia-ai-iot/vllm:latest-jetson-thor vllm serve meta-llama/Llama-3.1-8B \
--port 8000 \
--max-model-len 4096 \
--gpu-memory-utilization 0.9

模型详情

发布者

输入和输出

输入: Text / 输出: Text

用途

通用推理
代码生成
多语言

Jetson 兼容性

Thor 128GBThor 64GBOrin 64GBOrin 16GB

Llama 3.1 系列

模型	参数量	硬件	精度
Llama 3.1 8B	8B	Thor 128GB, Thor 64GB, Orin 64GB, Orin 16GB	NVFP4, BF16
Llama 3.1 70B	70B	Thor 128GB	NVFP4

模型路径

HF 镜像

https://hf-mirror.com/meta-llama/Llama-3.1-8B