升级到 vLLM >= 0.8

最后更新:2025/04/05。

安装

注意:此版本的 verl+vLLM 0.8+ 支持 FSDP 进行训练,并支持 vLLM 进行部署。

# 创建 conda 环境
conda create -n verl python==3.10
conda activate verl

# 安装 verl
git clone https://github.com/volcengine/verl.git
cd verl
pip3 install -e .

# 安装最新稳定版本的 vLLM
pip3 install vllm==0.8.3

# 安装 flash-attn
pip3 install flash-attn --no-build-isolation

我们提供了 verl+vLLM 0.8.3 的预构建 Docker 镜像。您可以使用以下命令直接导入:

docker pull hiyouga/verl:ngc-th2.6.0-cu126-vllm0.8.3-flashinfer0.2.2-cxx11abi0

功能

vLLM 0.8+ 在 verl 中默认支持 CUDA Граф(graph)和 V1 引擎。要启用这些功能,请记得在 bash 脚本中添加以下行:

actor_rollout_ref.rollout.enforce_eager=False \
actor_rollout_ref.rollout.free_cache_engine=True \

并且,如果存在,请移除该环境变量:

注意事项

当您直接升级 vllm>=0.8 时,一些依赖包的版本可能会发生变化。如果您遇到以下问题:

in <module> from torch.multiprocessing.reductions import ForkingPickler ImportError: cannot import name 'ForkingPickler' from 'torch.multiprocessing.reductions' (/opt/conda/lib/python3.11/site-packages/torch/multiprocessing/reductions.py)

您需要使用命令 pip install tensordict==0.6.2tensordict 升级到 0.6.2 版本。