奖励循环

最后更新：2025年10月10日。

Warning

奖励循环仍在进行中。

奖励循环旨在实现更灵活、更易用的奖励计算。

设计目标：

通过异步设计支持更高效的奖励计算
为用户定制的奖励函数提供更灵活的奖励模型接口
在多个奖励服务器之间提供请求级别的负载均衡