Jetson AI 模型中心

为 NVIDIA Jetson 设备提供一键部署命令。选择硬件、切换推理引擎、复制命令即可运行，无需手动配置环境。

快速入口

选择你需要的资源，快速开始

快速开始

从零配置 Jetson 设备，安装 Docker，运行你的第一个 AI 模型

硬件选型

对比 Jetson SOM 型号 — Thor 128GB、Orin 64GB、Orin Nano — 选择适合你的设备

镜像指南

Docker 镜像 OSS 下载导入 / 国内仓库加速，告别拉取慢与超时

性能优化

模型量化、MTP 推测解码、显存调优等加速技巧

精选模型

最新模型，上线即支持 Jetson 部署

查看全部模型

VLM30B-A3BNVFP4FP8

Nemotron 3 Nano Omni

NVIDIA 推出的全模态 MoE 推理模型，30B 总参数仅激活 3B，原生支持文本、图像、音频、视频四种输入，256K 上下文

部署模型

模型详情

Jetson 设备

推理引擎

运行命令

命令根据你的配置自动生成

sudo docker run -it --rm --pull always \
--runtime=nvidia --network host \
-e VLLM_USE_MODELSCOPE=True \
-v ~/models:/models \
vllm/vllm-openai:v0.20.0-ubuntu2404 vllm serve nvidia/Nemotron-3-Nano-Omni-30B-A3B-Reasoning-NVFP4 \
--port 8000 \
--max-model-len 32768 \
--gpu-memory-utilization 0.8

35B-A3BNVFP4INT4

Qwen3.6 35B-A3B

阿里 Qwen3.6 系列 MoE 模型，总参数 35B 仅激活 3B，支持 MTP 推测解码，原生支持推理和函数调用

部署模型

模型详情

Jetson 设备

推理引擎

运行命令

命令根据你的配置自动生成

sudo docker run -it --rm --pull always \
--runtime=nvidia --network host \
-e VLLM_USE_MODELSCOPE=True \
-v ~/models:/models \
vllm/vllm-openai:nightly-aarch64 vllm serve Qwen/Qwen3.6-35B-A3B \
--port 8000 \
--max-model-len 32768 \
--gpu-memory-utilization 0.9

查看全部模型

Jetson AI 模型中心

快速入口

快速开始

硬件选型

镜像指南

性能优化

精选模型

Nemotron 3 Nano Omni

部署模型

Qwen3.6 35B-A3B

部署模型

最新动态

Nemotron 3 Nano Omni

Qwen3 8B

Qwen3.6 27B

Qwen3.5 35B-A3B

MiniMax M2.7

Qwen3.5 27B