Logo

用户文档

  • 项目介绍
  • 安装
  • 核心算法及其实现
  • 运行试验
  • 试验输出
  • 绘制结果

强化学习介绍

  • 第一部分:强化学习中的核心概念
  • 第二部分:强化学习算法概述
  • 第三部分:策略优化介绍

资源

  • 深度强化学习研究者的资料
  • 深度强化学习的核心论文
  • 练习
  • Spinning Up 算法实现的基准

算法文档

  • Vanilla Policy Gradient
  • Trust Region Policy Optimization
  • Proximal Policy Optimization
  • Deep Deterministic Policy Gradient
  • Twin Delayed DDPG
  • Soft Actor-Critic

工具文档

  • 日志打印
  • 绘图
  • MPI 工具
  • 运行工具

其他

  • 致谢
  • 作者
  • 关于译者
Spinning Up
  • Docs »
  • Overview: module code

All modules for which code is available

  • spinup.algos.ddpg.ddpg
  • spinup.algos.ppo.ppo
  • spinup.algos.sac.sac
  • spinup.algos.td3.td3
  • spinup.algos.trpo.trpo
  • spinup.algos.vpg.vpg
  • spinup.utils.logx
  • spinup.utils.mpi_tf
  • spinup.utils.mpi_tools
  • spinup.utils.run_utils

© Copyright 2018, OpenAI.

Built with Sphinx using a theme provided by Read the Docs.