
opendilab/PPOxFamily:深入浅出深度强化学习
2024-07-19 16:12
项目简介: PPOxFamily 是一个由 OpenDILab 提供的公开课系列,旨在通过一系列详尽的教程和案例帮助学习者深入理解并实践深度强化学习中的 Proximal Policy Optimization (PPO) 算法。该项目包含从基础理论到实际应用的全面内容,涵盖决策智能的各个方面,特别