aoniAI Hub
返回模型列表

Qwen3.5 4B

阿里 Qwen3.5 系列 4B 视觉语言模型,262K 上下文,AWQ 4bit 量化适合 Jetson Orin 部署

参数量4B
模态Text, Image
精度INT4
类型VLM

快速部署

部署模型

命令根据你的配置自动生成
sudo docker run -it --rm --pull always \
--runtime=nvidia --network host \
-e VLLM_USE_MODELSCOPE=True \
-v ~/models:/models \
ghcr.io/nvidia-ai-iot/vllm:latest-jetson-orin vllm serve Qwen/Qwen3.5-4B \
--port 8000 \
--max-model-len 8192 \
--gpu-memory-utilization 0.8

模型详情

发布者
Alibaba
系列
Qwen3.5
参数量
4B
上下文长度
262,144 tokens
许可证
Apache 2.0

输入和输出

输入: Text, Image / 输出: Text, Image

用途

  • 视觉问答
  • 图像理解
  • 工具调用
  • 多语言任务

Jetson 兼容性

Thor 128GBThor 64GBOrin 64GBOrin 16GBOrin 8GB

标签

vlmalibabasmalledgetool-calling

Qwen3.5 系列

模型参数量
Qwen3.5 4B4B
Qwen3.5 35B-A3B35B-A3B
Qwen3.5 27B27B
Qwen3.5 9B9B
Qwen3.5 0.8B0.8B

模型路径