← 引擎目录

vLLM

0.6.0 维护: community

Most widely used; ascend / rocm / musa forks for non-NVIDIA hardware

资源

源码

https://github.com/vllm-project/vllm

文档

https://docs.vllm.ai/

支持厂商

nvidia, amd, intel, aws, google, huawei, cambricon, hygon, moore-threads

兼容硬件 (32)

AMD Instinct MI300A 官方 AMD Instinct MI300X 官方 AMD Instinct MI325X 官方 AMD Instinct MI355X 官方 Apple M4 Max Neural Engine 社区 AWS Inferentia 2 社区 AWS Trainium 2 社区 Cerebras WSE-3 社区燧原云燧 T21 社区 Etched Sohu 社区 Google TPU v5p 社区 Google TPU Trillium (v6e) 社区 Groq LPU (TSP v1) 社区昇腾 910B 社区昇腾 910C 社区昇腾 950 社区海光 DCU K100 社区海光 DCU Z100 社区 Intel Gaudi 2 社区 Intel Gaudi 3 社区摩尔线程 MTT S4000 社区 NVIDIA A100 SXM4 80GB 官方 NVIDIA B200 SXM 180GB 官方 NVIDIA B300 SXM 288GB 官方 NVIDIA GB200 NVL72 官方 NVIDIA GB300 NVL72 官方 NVIDIA H100 SXM5 80GB 官方 NVIDIA H200 SXM 141GB 官方 NVIDIA L40S 官方 NVIDIA R200 SXM (Vera Rubin) 官方 SambaNova SN40L 社区 Tenstorrent Wormhole n300 社区

使用本引擎的案例 (15)