用户文档

项目介绍
安装
核心算法及其实现
运行试验
试验输出
绘制结果

强化学习介绍

第一部分：强化学习中的核心概念
第二部分：强化学习算法概述
第三部分：策略优化介绍

资源

深度强化学习研究者的资料
深度强化学习的核心论文
练习
Spinning Up 算法实现的基准

算法文档

Vanilla Policy Gradient
Trust Region Policy Optimization
Proximal Policy Optimization
Deep Deterministic Policy Gradient
Twin Delayed DDPG
Soft Actor-Critic

工具文档

日志打印
绘图
MPI 工具
运行工具

其他

致谢
作者
关于译者

Spinning Up

Docs »
Overview: module code

All modules for which code is available

spinup.algos.ddpg.ddpg
spinup.algos.ppo.ppo
spinup.algos.sac.sac
spinup.algos.td3.td3
spinup.algos.trpo.trpo
spinup.algos.vpg.vpg
spinup.utils.logx
spinup.utils.mpi_tf
spinup.utils.mpi_tools
spinup.utils.run_utils

© Copyright 2018, OpenAI.

Built with Sphinx using a theme provided by Read the Docs.