ROLL 框架实现了 GPU 时分复用功能,通过 offload/reload 能力,可以在不同角色间灵活共享 GPU 资源。本文档将详细介绍如何使用这一功能。
时分复用概述
在 ROLL 框架中,不同的角色(如 actor_train、actor_infer、critic、reference 和 rewards)可能需要使用相同的 GPU 资源。为了提高资源利用率,框架实现了 GPU 时分复用功能,允许在不同时间点将模型状态在 GPU 和 CPU 之间进行切换。
Offload/Reload 控制机制
自动控制