返回模型列表
发布者 Meta 系列 Llama 3.1 参数量 8B 上下文长度 131,072 tokens 许可证 Llama 3.1 Community License
Llama 3.1 8B
Meta Llama 3.1 系列 8B 通用语言模型,多语言支持和强大的指令遵循能力
参数量8B
模态Text
精度NVFP4 · BF16
类型LLM
快速部署
部署模型
命令根据你的配置自动生成
sudo docker run -it --rm --pull always \
--runtime=nvidia --network host \
-e VLLM_USE_MODELSCOPE=True \
-v ~/models:/models \
ghcr.io/nvidia-ai-iot/vllm:latest-jetson-thor vllm serve meta-llama/Llama-3.1-8B \
--port 8000 \
--max-model-len 4096 \
--gpu-memory-utilization 0.9模型详情
输入和输出
输入: Text / 输出: Text
用途
- 通用推理
- 代码生成
- 多语言
Jetson 兼容性
Thor 128GBThor 64GBOrin 64GBOrin 16GB
标签
llmmetageneral-purposemultilingual
Llama 3.1 系列
| 模型 | 参数量 | 硬件 | 精度 |
|---|---|---|---|
| Llama 3.1 8B | 8B | Thor 128GB, Thor 64GB, Orin 64GB, Orin 16GB | NVFP4, BF16 |
| Llama 3.1 70B | 70B | Thor 128GB | NVFP4 |