Alibaba (Qwen)
阿里巴巴
模型
3
部署案例
4
模型 (3)
部署案例 (4)
- Qwen2.5-Coder 32B on 4× L40S with vLLM (FP8)l40s ×4 · qwen2.5-coder-32b · 580 tok/s
- Qwen3.6 Plus on 8× MI325X with SGLang FP8mi325x ×8 · qwen3.6-plus · 3100 tok/s
- Qwen3.5 397B Reasoning on 8× MI355X with FP4mi355x ×8 · qwen3.5-397b · 4500 tok/s
- Qwen3.6 Plus on 8× Cambricon MLU590 with LMDeploymlu590 ×8 · qwen3.6-plus · 380 tok/s