支持的模型
在 Jetson 设备上运行最新的 AI 大模型
共 43 个模型
Qwen3.6(2)
Qwen3.5(5)
Qwen3.5 35B-A3B
阿里 Qwen3.5 系列 MoE 视觉语言模型,总参数 35B 仅激活 3B,262K 上下文,支持图文理解、函数调用和多语言
Alibaba
Qwen3.5 27B
阿里 Qwen3.5 系列 27B 稠密视觉语言模型,262K 上下文,支持图文理解、推理、函数调用和多语言
Alibaba
Qwen3.5 9B
阿里 Qwen3.5 系列 9B 视觉语言模型,262K 上下文,支持图文理解、工具调用和代理
Alibaba
Qwen3.5 4B
阿里 Qwen3.5 系列 4B 视觉语言模型,262K 上下文,AWQ 4bit 量化适合 Jetson Orin 部署
Alibaba
Qwen3.5 0.8B
阿里 Qwen3.5 系列最小视觉语言模型,0.8B 参数,262K 上下文,BF16 精度,适合快速原型和轻量边缘部署
Alibaba
MiniMax M2(1)
MiniMax M2.7
MiniMax 推出的 229B MoE 稀疏大模型,每次激活 10B 参数,196K 上下文,专为超长代码代理、安全审计、SRE 运维场景设计
MiniMax
Gemma 4(4)
Gemma 4 E2B
Google Gemma 4 系列,5.1B 总参数 / 2.3B 有效参数,128K 上下文,支持文本、图像、音频
Gemma 4 E4B
Google Gemma 4 系列,8B 总参数 / 4.5B 有效参数,128K 上下文,支持文本、图像、音频
Gemma 4 26B-A4B
Google Gemma 4 系列 MoE 模型,25.8B 总参数 / 3.8B 激活,256K 上下文,支持文本和图像理解
Gemma 4 31B
Google Gemma 4 系列 30.7B 稠密旗舰模型,256K 上下文,Arena AI 文本排行榜开源模型第 3 名
Ministral 3(6)
Ministral 3 3B Instruct
Mistral AI 推出的 3B 指令型视觉语言模型,262K 上下文,FP8 精度,支持多语言、函数调用和视觉理解
Mistral AI
Ministral 3 8B Instruct
Mistral AI 推出的 8B 指令型视觉语言模型,262K 上下文,FP8 精度
Mistral AI
Ministral 3 14B Instruct
Mistral AI 推出的 14B 指令型视觉语言模型,262K 上下文,FP8 精度
Mistral AI
Ministral 3 3B Reasoning
Mistral AI 推出的 3B 推理型视觉语言模型,262K 上下文,FP16 精度,专注逻辑推理和问题求解
Mistral AI
Ministral 3 8B Reasoning
Mistral AI 推出的 8B 推理型视觉语言模型,262K 上下文,FP16 精度
Mistral AI
Ministral 3 14B Reasoning
Mistral AI 推出的 14B 推理型视觉语言模型,262K 上下文,FP16 精度
Mistral AI
Nemotron(5)
Nemotron 3 Nano Omni
NVIDIA 推出的全模态 MoE 推理模型,30B 总参数仅激活 3B,原生支持文本、图像、音频、视频四种输入,256K 上下文
NVIDIA
Nemotron3 Nano 4B
NVIDIA Nemotron3 Nano 4B 语言模型,NVFP4 精度优化
NVIDIA
Nemotron Nano 9B v2
NVIDIA Nemotron Nano 9B v2 语言模型
NVIDIA
Nemotron Nano 12B VL
NVIDIA Nemotron Nano 12B 视觉语言模型
NVIDIA
Nemotron3 Nano 30B-A3B
NVIDIA Nemotron3 Nano MoE 模型,30B 总参数仅激活 3B
NVIDIA
Qwen3(4)
Qwen3 4B
阿里巴巴 Qwen3 系列的小型语言模型,4B 参数,适合资源受限的边缘设备部署
Alibaba
Qwen3 30B-A3B
阿里巴巴 Qwen3 系列 MoE 模型,30B 总参数仅激活 3B,兼顾性能与效率
Alibaba
Qwen3 8B
阿里巴巴 Qwen3 系列的中型语言模型,8B 参数,原生支持思考模式,适合单 GPU 部署的通用文本任务
Alibaba
Qwen3 VL(2)
Llama 3.1(2)
Llama 3.2(1)
Llama 3.2 3B
Meta Llama 3.2 系列 3B 小型语言模型,专为边缘和移动设备优化
Meta
Gemma 3(5)
Gemma 3 1B
Google Gemma 3 系列 1B 轻量语言模型,适合资源受限设备
Gemma 3 270M
Google Gemma 3 系列 270M 超轻量语言模型
Cosmos Reason(3)
Cosmos Reason 1 7B
NVIDIA 推出的 7B 物理世界推理视觉语言模型,专为物理 AI 和机器人应用设计
NVIDIA
Cosmos Reason 2 2B
NVIDIA Cosmos Reason 2 系列 2B 视觉语言模型
NVIDIA
Cosmos Reason 2 8B
NVIDIA Cosmos Reason 2 系列 8B 视觉语言模型
NVIDIA
GPT OSS(2)
Gemma(1)
FunctionGemma
Google 推出的函数调用专用 Gemma 模型,270M 参数,专为工具调用和结构化输出优化