返回模型列表
发布者 Alibaba 系列 Qwen3 VL 参数量 4B 上下文长度 32,768 tokens 许可证 Apache 2.0
Qwen3 VL 4B
阿里巴巴 Qwen3 VL 系列 4B 视觉语言模型,适合边缘设备视觉任务
参数量4B
模态Text, Image
精度NVFP4 · BF16
类型VLM
快速部署
部署模型
命令根据你的配置自动生成
sudo docker run -it --rm --pull always \
--runtime=nvidia --network host \
-e VLLM_USE_MODELSCOPE=True \
-v ~/models:/models \
ghcr.io/nvidia-ai-iot/vllm:latest-jetson-orin vllm serve Qwen/Qwen3-VL-4B \
--port 8000 \
--max-model-len 4096 \
--gpu-memory-utilization 0.8模型详情
输入和输出
输入: Text, Image / 输出: Text, Image
用途
- 视觉问答
- 边缘视觉
- 图像理解
Jetson 兼容性
Thor 128GBThor 64GBOrin 64GBOrin 16GBOrin 8GB
标签
vlmalibabavisionedgesmall
Qwen3 VL 系列
| 模型 | 参数量 | 硬件 | 精度 |
|---|---|---|---|
| Qwen3 VL 4B | 4B | Thor 128GB, Thor 64GB, Orin 64GB, Orin 16GB, Orin 8GB | NVFP4, BF16 |
| Qwen3 VL 8B | 8B | Thor 128GB, Thor 64GB, Orin 64GB, Orin 16GB | NVFP4, BF16 |