返回模型列表
发布者 NVIDIA 系列 Nemotron 参数量 9B 上下文长度 32,768 tokens 许可证 NVIDIA Open Model License
Nemotron Nano 9B v2
NVIDIA Nemotron Nano 9B v2 语言模型
参数量9B
模态Text
精度NVFP4 · BF16
类型LLM
快速部署
部署模型
命令根据你的配置自动生成
sudo docker run -it --rm --pull always \
--runtime=nvidia --network host \
-e VLLM_USE_MODELSCOPE=True \
-v ~/models:/models \
ghcr.io/nvidia-ai-iot/vllm:latest-jetson-thor vllm serve nvidia/Nemotron-Nano-9B-v2 \
--port 8000 \
--max-model-len 4096 \
--gpu-memory-utilization 0.85模型详情
输入和输出
输入: Text / 输出: Text
用途
- 通用推理
- 代码生成
Jetson 兼容性
Thor 128GBThor 64GBOrin 64GBOrin 16GB
标签
llmnvidiamedium
Nemotron 系列
| 模型 | 参数量 | 硬件 | 精度 |
|---|---|---|---|
| Nemotron Nano 9B v2 | 9B | Thor 128GB, Thor 64GB, Orin 64GB, Orin 16GB | NVFP4, BF16 |
| Nemotron-3-Nano-Omni | 30B-A3B | Thor 128GB, Thor 64GB, Orin 64GB, Orin 16GB, Orin 8GB | NVFP4, FP8, BF16, INT4 |
| Nemotron3 Nano 4B | 4B | Thor 128GB, Thor 64GB, Orin 64GB, Orin 16GB, Orin 8GB | NVFP4, BF16 |
| Nemotron Nano 12B VL | 12B | Thor 128GB, Thor 64GB, Orin 64GB, Orin 16GB | NVFP4, BF16 |
| Nemotron3 Nano 30B-A3B | 30B-A3B | Thor 128GB, Thor 64GB, Orin 64GB, Orin 16GB | NVFP4, BF16 |