aoniAI Hub

支持的模型

在 Jetson 设备上运行最新的 AI 大模型

硬件:

43 个模型

Qwen3.6(2)

LLM27B19 GB

Qwen3.6 27B

阿里 Qwen3.6 系列 27B 稠密模型,19GB NVFP4 量化,支持 MTP 推测解码,强推理和函数调用能力

thor 128gbthor 64gborin 64gborin 16gborin 8gb

Alibaba

LLM35B-A3B

Qwen3.6 35B-A3B

阿里 Qwen3.6 系列 MoE 模型,总参数 35B 仅激活 3B,支持 MTP 推测解码,原生支持推理和函数调用

thor 128gbthor 64gborin 64gborin 16gborin 8gb

Alibaba

Qwen3.5(5)

VLMVLM35B-A3B

Qwen3.5 35B-A3B

阿里 Qwen3.5 系列 MoE 视觉语言模型,总参数 35B 仅激活 3B,262K 上下文,支持图文理解、函数调用和多语言

thor 128gbthor 64gborin 64gborin 16gborin 8gb

Alibaba

VLMVLM27B

Qwen3.5 27B

阿里 Qwen3.5 系列 27B 稠密视觉语言模型,262K 上下文,支持图文理解、推理、函数调用和多语言

thor 128gbthor 64gborin 64gborin 16gborin 8gb

Alibaba

VLMVLM9B

Qwen3.5 9B

阿里 Qwen3.5 系列 9B 视觉语言模型,262K 上下文,支持图文理解、工具调用和代理

thor 128gbthor 64gborin 64gborin 16gborin 8gb

Alibaba

VLMVLM4B

Qwen3.5 4B

阿里 Qwen3.5 系列 4B 视觉语言模型,262K 上下文,AWQ 4bit 量化适合 Jetson Orin 部署

thor 128gbthor 64gborin 64gborin 16gborin 8gb

Alibaba

VLMVLM0.8B

Qwen3.5 0.8B

阿里 Qwen3.5 系列最小视觉语言模型,0.8B 参数,262K 上下文,BF16 精度,适合快速原型和轻量边缘部署

thor 128gbthor 64gborin 64gborin 16gborin 8gb

Alibaba

MiniMax M2(1)

LLM229B-A10B~101 GB

MiniMax M2.7

MiniMax 推出的 229B MoE 稀疏大模型,每次激活 10B 参数,196K 上下文,专为超长代码代理、安全审计、SRE 运维场景设计

thor 128gbthor 64gb

MiniMax

Gemma 4(4)

LLM5.1B-A2.3B

Gemma 4 E2B

Google Gemma 4 系列,5.1B 总参数 / 2.3B 有效参数,128K 上下文,支持文本、图像、音频

thor 128gbthor 64gborin 64gborin 16gborin 8gb

Google

LLM8B-A4.5B

Gemma 4 E4B

Google Gemma 4 系列,8B 总参数 / 4.5B 有效参数,128K 上下文,支持文本、图像、音频

thor 128gbthor 64gborin 64gborin 16gborin 8gb

Google

LLM26B-A4B

Gemma 4 26B-A4B

Google Gemma 4 系列 MoE 模型,25.8B 总参数 / 3.8B 激活,256K 上下文,支持文本和图像理解

thor 128gbthor 64gborin 64gborin 16gborin 8gb

Google

LLM31B

Gemma 4 31B

Google Gemma 4 系列 30.7B 稠密旗舰模型,256K 上下文,Arena AI 文本排行榜开源模型第 3 名

thor 128gbthor 64gborin 64gb

Google

Ministral 3(6)

VLMVLM3B

Ministral 3 3B Instruct

Mistral AI 推出的 3B 指令型视觉语言模型,262K 上下文,FP8 精度,支持多语言、函数调用和视觉理解

thor 128gbthor 64gborin 64gborin 16gborin 8gb

Mistral AI

VLMVLM8B

Ministral 3 8B Instruct

Mistral AI 推出的 8B 指令型视觉语言模型,262K 上下文,FP8 精度

thor 128gbthor 64gborin 64gborin 16gborin 8gb

Mistral AI

VLMVLM14B

Ministral 3 14B Instruct

Mistral AI 推出的 14B 指令型视觉语言模型,262K 上下文,FP8 精度

thor 128gbthor 64gborin 64gborin 16gb

Mistral AI

VLMVLM3B

Ministral 3 3B Reasoning

Mistral AI 推出的 3B 推理型视觉语言模型,262K 上下文,FP16 精度,专注逻辑推理和问题求解

thor 128gbthor 64gborin 64gborin 16gborin 8gb

Mistral AI

VLMVLM8B

Ministral 3 8B Reasoning

Mistral AI 推出的 8B 推理型视觉语言模型,262K 上下文,FP16 精度

thor 128gbthor 64gborin 64gborin 16gborin 8gb

Mistral AI

VLMVLM14B

Ministral 3 14B Reasoning

Mistral AI 推出的 14B 推理型视觉语言模型,262K 上下文,FP16 精度

thor 128gbthor 64gborin 64gborin 16gb

Mistral AI

Nemotron(5)

VLMVLM30B-A3B

Nemotron 3 Nano Omni

NVIDIA 推出的全模态 MoE 推理模型,30B 总参数仅激活 3B,原生支持文本、图像、音频、视频四种输入,256K 上下文

thor 128gbthor 64gborin 64gborin 16gborin 8gb

NVIDIA

LLM4B

Nemotron3 Nano 4B

NVIDIA Nemotron3 Nano 4B 语言模型,NVFP4 精度优化

thor 128gbthor 64gborin 64gborin 16gborin 8gb

NVIDIA

LLM9B

Nemotron Nano 9B v2

NVIDIA Nemotron Nano 9B v2 语言模型

thor 128gbthor 64gborin 64gborin 16gb

NVIDIA

VLMVLM12B

Nemotron Nano 12B VL

NVIDIA Nemotron Nano 12B 视觉语言模型

thor 128gbthor 64gborin 64gborin 16gb

NVIDIA

LLM30B-A3B

Nemotron3 Nano 30B-A3B

NVIDIA Nemotron3 Nano MoE 模型,30B 总参数仅激活 3B

thor 128gbthor 64gborin 64gborin 16gb

NVIDIA

Qwen3(4)

LLM4B

Qwen3 4B

阿里巴巴 Qwen3 系列的小型语言模型,4B 参数,适合资源受限的边缘设备部署

thor 128gbthor 64gborin 64gborin 16gborin 8gb

Alibaba

LLM30B-A3B

Qwen3 30B-A3B

阿里巴巴 Qwen3 系列 MoE 模型,30B 总参数仅激活 3B,兼顾性能与效率

thor 128gbthor 64gborin 64gborin 16gb

Alibaba

LLM32B

Qwen3 32B

阿里巴巴 Qwen3 系列 32B 稠密模型,旗舰级通用能力,原生支持思考模式

thor 128gbthor 64gborin 64gb

Alibaba

LLM8B5.5 GB

Qwen3 8B

阿里巴巴 Qwen3 系列的中型语言模型,8B 参数,原生支持思考模式,适合单 GPU 部署的通用文本任务

thor 128gbthor 64gborin 64gborin 16gb

Alibaba

Qwen3 VL(2)

VLMVLM8B

Qwen3 VL 8B

阿里巴巴 Qwen3 VL 系列 8B 视觉语言模型,支持图像理解和文本生成

thor 128gbthor 64gborin 64gborin 16gb

Alibaba

VLMVLM4B

Qwen3 VL 4B

阿里巴巴 Qwen3 VL 系列 4B 视觉语言模型,适合边缘设备视觉任务

thor 128gbthor 64gborin 64gborin 16gborin 8gb

Alibaba

Llama 3.1(2)

LLM8B

Llama 3.1 8B

Meta Llama 3.1 系列 8B 通用语言模型,多语言支持和强大的指令遵循能力

thor 128gbthor 64gborin 64gborin 16gb

Meta

LLM70B

Llama 3.1 70B

Meta Llama 3.1 系列 70B 大语言模型,旗舰级通用能力

thor 128gb

Meta

Llama 3.2(1)

LLM3B

Llama 3.2 3B

Meta Llama 3.2 系列 3B 小型语言模型,专为边缘和移动设备优化

thor 128gbthor 64gborin 64gborin 16gborin 8gb

Meta

Gemma 3(5)

LLM1B

Gemma 3 1B

Google Gemma 3 系列 1B 轻量语言模型,适合资源受限设备

thor 128gbthor 64gborin 64gborin 16gborin 8gb

Google

LLM4B

Gemma 3 4B

Google Gemma 3 系列 4B 语言模型

thor 128gbthor 64gborin 64gborin 16gborin 8gb

Google

LLM12B

Gemma 3 12B

Google Gemma 3 系列 12B 中型语言模型

thor 128gbthor 64gborin 64gborin 16gb

Google

LLM270M

Gemma 3 270M

Google Gemma 3 系列 270M 超轻量语言模型

thor 128gbthor 64gborin 64gborin 16gborin 8gb

Google

LLM27B

Gemma 3 27B

Google Gemma 3 系列 27B 大型语言模型

thor 128gbthor 64gborin 64gb

Google

Cosmos Reason(3)

VLMVLM7B

Cosmos Reason 1 7B

NVIDIA 推出的 7B 物理世界推理视觉语言模型,专为物理 AI 和机器人应用设计

thor 128gbthor 64gborin 64gborin 16gb

NVIDIA

VLMVLM2B

Cosmos Reason 2 2B

NVIDIA Cosmos Reason 2 系列 2B 视觉语言模型

thor 128gbthor 64gborin 64gborin 16gborin 8gb

NVIDIA

VLMVLM8B

Cosmos Reason 2 8B

NVIDIA Cosmos Reason 2 系列 8B 视觉语言模型

thor 128gbthor 64gborin 64gborin 16gb

NVIDIA

GPT OSS(2)

LLM20B

GPT OSS 20B

OpenAI 开源 GPT OSS 20B 模型,NVFP4 精度优化

thor 128gbthor 64gborin 64gb

OpenAI

LLM120B

GPT OSS 120B

OpenAI 开源 GPT OSS 120B 大语言模型,NVFP4 精度优化

thor 128gb

OpenAI

Gemma(1)

LLM270M

FunctionGemma

Google 推出的函数调用专用 Gemma 模型,270M 参数,专为工具调用和结构化输出优化

thor 128gbthor 64gborin 64gborin 16gborin 8gb

Google