GPT OSS 20B

OpenAI 开源 GPT OSS 20B 模型，NVFP4 精度优化

参数量20B

模态Text

精度NVFP4

类型LLM

在 HuggingFace 查看

Jetson 部署命令模型详情

快速部署

部署模型

Jetson 设备

推理引擎

运行命令

命令根据你的配置自动生成

sudo docker run -it --rm --pull always \
--runtime=nvidia --network host \
-e VLLM_USE_MODELSCOPE=True \
-v ~/models:/models \
vllm/vllm-openai:nightly-aarch64 vllm serve openai/gpt-oss-20b \
--port 8000 \
--max-model-len 4096 \
--gpu-memory-utilization 0.9

模型详情

发布者

OpenAI

系列

GPT OSS

参数量

20B

上下文长度

32,768 tokens

许可证

Apache 2.0

输入和输出

输入: Text / 输出: Text

用途

通用推理
代码生成

Jetson 兼容性

Thor 128GBThor 64GBOrin 64GB

GPT OSS 系列

模型	参数量	硬件	精度
GPT OSS 20B	20B	Thor 128GB, Thor 64GB, Orin 64GB	NVFP4
GPT OSS 120B	120B	Thor 128GB	NVFP4

模型路径

HF 镜像

https://hf-mirror.com/openai/gpt-oss-20b

OSS 下载

https://ai-hub.tos-cn-guangzhou.volces.com/models/openai/GPT-OSS-20B.tar.gz