返回模型列表
发布者 Alibaba 系列 Qwen3.5 参数量 0.8B 上下文长度 262,144 tokens 许可证 Apache 2.0
Qwen3.5 0.8B
阿里 Qwen3.5 系列最小视觉语言模型,0.8B 参数,262K 上下文,BF16 精度,适合快速原型和轻量边缘部署
参数量0.8B
模态Text, Image
精度BF16
类型VLM
快速部署
部署模型
命令根据你的配置自动生成
sudo docker run -it --rm --pull always \
--runtime=nvidia --network host \
-e VLLM_USE_MODELSCOPE=True \
-v ~/models:/models \
ghcr.io/nvidia-ai-iot/vllm:latest-jetson-orin vllm serve Qwen/Qwen3.5-0.8B \
--port 8000 \
--max-model-len 8192 \
--gpu-memory-utilization 0.8模型详情
输入和输出
输入: Text, Image / 输出: Text, Image
用途
- 视觉问答
- 图像理解
- 工具调用
- 快速原型
Jetson 兼容性
Thor 128GBThor 64GBOrin 64GBOrin 16GBOrin 8GB
标签
vlmalibabatinyedgerapid-prototyping
Qwen3.5 系列
| 模型 | 参数量 | 硬件 | 精度 |
|---|---|---|---|
| Qwen3.5 0.8B | 0.8B | Thor 128GB, Thor 64GB, Orin 64GB, Orin 16GB, Orin 8GB | BF16 |
| Qwen3.5 35B-A3B | 35B-A3B | Thor 128GB, Thor 64GB, Orin 64GB, Orin 16GB, Orin 8GB | NVFP4, INT4 |
| Qwen3.5 27B | 27B | Thor 128GB, Thor 64GB, Orin 64GB, Orin 16GB, Orin 8GB | NVFP4, INT4 |
| Qwen3.5 9B | 9B | Thor 128GB, Thor 64GB, Orin 64GB, Orin 16GB, Orin 8GB | NVFP4, INT4 |
| Qwen3.5 4B | 4B | Thor 128GB, Thor 64GB, Orin 64GB, Orin 16GB, Orin 8GB | INT4 |