aoniAI Hub
返回模型列表

Nemotron3 Nano 30B-A3B

NVIDIA Nemotron3 Nano MoE 模型,30B 总参数仅激活 3B

参数量30B-A3B
模态Text
精度NVFP4 · BF16
类型LLM

快速部署

部署模型

命令根据你的配置自动生成
sudo docker run -it --rm --pull always \
--runtime=nvidia --network host \
-e VLLM_USE_MODELSCOPE=True \
-v ~/models:/models \
vllm/vllm-openai:nightly-aarch64 vllm serve nvidia/Nemotron-3-Nano-30B-A3B \
--port 8000 \
--max-model-len 8192 \
--gpu-memory-utilization 0.9

模型详情

发布者
NVIDIA
系列
Nemotron
参数量
30B-A3B
上下文长度
32,768 tokens
许可证
NVIDIA Open Model License

输入和输出

输入: Text / 输出: Text

用途

  • 通用推理
  • 代码生成

Jetson 兼容性

Thor 128GBThor 64GBOrin 64GBOrin 16GB

标签

llmnvidiamoe

Nemotron 系列

模型参数量
Nemotron3 Nano 30B-A3B30B-A3B
Nemotron-3-Nano-Omni30B-A3B
Nemotron3 Nano 4B4B
Nemotron Nano 9B v29B
Nemotron Nano 12B VL12B

模型路径