Qwen3.5 35B-A3B

阿里 Qwen3.5 系列 MoE 视觉语言模型，总参数 35B 仅激活 3B，262K 上下文，支持图文理解、函数调用和多语言

参数量35B-A3B

模态Text, Image

精度NVFP4 · INT4

类型VLM

在 HuggingFace 查看

Jetson 部署命令模型详情

快速部署

部署模型

Jetson 设备

推理引擎

运行命令

命令根据你的配置自动生成

sudo docker run -it --rm --pull always \
--runtime=nvidia --network host \
-e VLLM_USE_MODELSCOPE=True \
-v ~/models:/models \
vllm/vllm-openai:nightly-aarch64 vllm serve Qwen/Qwen3.5-35B-A3B \
--port 8000 \
--max-model-len 32768 \
--gpu-memory-utilization 0.9

模型详情

发布者

Alibaba

系列

Qwen3.5

参数量

35B-A3B

上下文长度

262,144 tokens

许可证

Apache 2.0

输入和输出

输入: Text, Image / 输出: Text, Image

用途

视觉推理
图像理解
函数调用
多语言
代码生成

Jetson 兼容性

Thor 128GBThor 64GBOrin 64GBOrin 16GBOrin 8GB

推测解码 (MTP)

MTP 通过每步预测多个 token 来提高推理吞吐量。

{"method":"mtp","num_speculative_tokens":4}

Qwen3.5 系列

模型	参数量	硬件	精度
Qwen3.5 35B-A3B	35B-A3B	Thor 128GB, Thor 64GB, Orin 64GB, Orin 16GB, Orin 8GB	NVFP4, INT4
Qwen3.5 27B	27B	Thor 128GB, Thor 64GB, Orin 64GB, Orin 16GB, Orin 8GB	NVFP4, INT4
Qwen3.5 9B	9B	Thor 128GB, Thor 64GB, Orin 64GB, Orin 16GB, Orin 8GB	NVFP4, INT4
Qwen3.5 4B	4B	Thor 128GB, Thor 64GB, Orin 64GB, Orin 16GB, Orin 8GB	INT4
Qwen3.5 0.8B	0.8B	Thor 128GB, Thor 64GB, Orin 64GB, Orin 16GB, Orin 8GB	BF16

模型路径

ModelScope

https://modelscope.cn/models/Qwen/Qwen3.5-35B-A3B

HF 镜像

https://hf-mirror.com/Qwen/Qwen3.5-35B-A3B

OSS 下载

https://ai-hub.tos-cn-guangzhou.volces.com/models/qwen/Qwen3.5-35B-A3B.tar.gz

OSS 下载

https://ai-hub.tos-cn-guangzhou.volces.com/models/qwen/Qwen3.5-35B-A3B-NVFP4.tar.gz

OSS 下载

https://ai-hub.tos-cn-guangzhou.volces.com/models/qwen/Qwen3.5-35B-A3B-W4A16.tar.gz

Qwen3.5 35B-A3B

快速部署

部署模型

模型详情

输入和输出

用途

Jetson 兼容性

标签

推测解码 (MTP)

Qwen3.5 系列

模型路径