返回指南列表
模型部署部署vLLMllama.cppOllamaDocker
镜像指南:OSS 下载导入 / 国内镜像仓库加速
Docker 镜像 OSS 下载导入 / 国内镜像仓库加速,告别拉取慢与超时
镜像指南
为解决国内用户无法直接访问 Docker Hub / GitHub Container Registry 的问题,我们提供两种方式获取 Jetson AI 推理镜像。
方式一:OSS 下载 + docker load(推荐离线环境)
我们在国内 OSS(火山引擎 TOS)上预置了所有常用推理镜像的 tar 包,直接下载后在 Jetson 设备上导入。
1. 下载镜像包
从 OSS 下载对应镜像的 tar 包:
# 以 vLLM Jetson Orin 镜像为例
wget https://tos-aoni.volces.com/jetson-images/vllm-jetson-orin-latest.tar.gz
2. 解压并导入
# 解压
gunzip vllm-jetson-orin-latest.tar.gz
# 导入 Docker
docker load -i vllm-jetson-orin-latest.tar
# 验证
docker images | grep vllm
3. 运行模型
导入后即可正常使用,与在线拉取完全一致:
sudo docker run -it --rm --pull never \
--runtime=nvidia --network host \
-e VLLM_USE_MODELSCOPE=True \
vllm-jetson-orin:latest \
vllm serve RedHatAI/Qwen3-4B-quantized.w4a16 \
--port 8000 --gpu-memory-utilization 0.8
注意:使用
--pull never避免尝试从远程拉取。
可用镜像列表
| 镜像名称 | OSS 路径 | 大小 | 适用平台 |
|---|---|---|---|
| vLLM Thor | jetson-images/vllm-thor-latest.tar.gz |
~3 GB | Thor T5000/T4000 |
| vLLM Orin | jetson-images/vllm-orin-latest.tar.gz |
~2.5 GB | AGX Orin / NX / Nano |
| llama.cpp Thor | jetson-images/llamacpp-thor-latest.tar.gz |
~1.5 GB | Thor |
| llama.cpp Orin | jetson-images/llamacpp-orin-latest.tar.gz |
~1.2 GB | Orin 全系列 |
方式二:配置国内镜像仓库(推荐联网环境)
将 Docker 镜像源指向我们的国内公有云仓库,docker pull 自动走国内加速。
1. 配置 daemon.json
sudo mkdir -p /etc/docker
sudo tee /etc/docker/daemon.json <<-'EOF'
{
"registry-mirrors": [
"https://mirrors.aoniai.com"
],
"insecure-registries": [],
"max-concurrent-downloads": 10,
"log-driver": "json-file",
"log-opts": {
"max-size": "10m",
"max-file": "3"
}
}
EOF
2. 重启 Docker
sudo systemctl daemon-reload
sudo systemctl restart docker
3. 验证配置
docker info | grep -A 5 "Registry Mirrors"
# 应输出类似:
# Registry Mirrors:
# https://mirrors.aoniai.com/
4. 正常拉取
配置完成后,docker pull 将自动从国内镜像仓库加速:
# 拉取镜像 — 自动走国内加速
sudo docker pull ghcr.io/nvidia-ai-iot/vllm:latest-jetson-orin
# 也可使用我们提供的短域名别名
sudo docker pull mirrors.aoniai.com/vllm:orin-latest
方式对比
| OSS 下载导入 | 镜像仓库加速 | |
|---|---|---|
| 网络要求 | 仅下载时联网 | 需持续联网 |
| 速度 | 取决于带宽,支持断点续传 | 首次较慢,后续有缓存 |
| 适用场景 | 离线/内网环境、批量部署 | 开发调试、在线环境 |
| 更新方式 | 重新下载 tar 包 | docker pull |
| 镜像版本 | 手动选择 tar 包 | 自动获取 latest |
Docker 镜像命名与对应表
推理引擎镜像
| 原始镜像 | OSS tar 包 | 镜像仓库别名 |
|---|---|---|
ghcr.io/nvidia-ai-iot/vllm:latest-jetson-thor |
vllm-thor-latest.tar.gz |
mirrors.aoniai.com/vllm:thor-latest |
ghcr.io/nvidia-ai-iot/vllm:latest-jetson-orin |
vllm-orin-latest.tar.gz |
mirrors.aoniai.com/vllm:orin-latest |
ghcr.io/nvidia-ai-iot/llama_cpp:latest-jetson-thor |
llamacpp-thor-latest.tar.gz |
mirrors.aoniai.com/llamacpp:thor-latest |
ghcr.io/nvidia-ai-iot/llama_cpp:latest-jetson-orin |
llamacpp-orin-latest.tar.gz |
mirrors.aoniai.com/llamacpp:orin-latest |