Reinforcement Learning Tutorials:

2020-10-07 added support for Tensorflow 2.3.1

PPO and PPO_CNN agents playing Pong-v0 game:

2020-10-10 added LunarLander-v2_PPO Continuous code for Tensorflow 2.3.1:

2020-10-23 added BipedalWalker-v3_PPO code for Tensorflow 2.3.1:

Name		Name	Last commit message	Last commit date
Latest commit History 84 Commits
01_CartPole-reinforcement-learning		01_CartPole-reinforcement-learning
02_CartPole-reinforcement-learning_DDQN		02_CartPole-reinforcement-learning_DDQN
03_CartPole-reinforcement-learning_Dueling_DDQN		03_CartPole-reinforcement-learning_Dueling_DDQN
04_CartPole-reinforcement-learning_e_greedy_D3QN		04_CartPole-reinforcement-learning_e_greedy_D3QN
05_CartPole-reinforcement-learning_PER_D3QN		05_CartPole-reinforcement-learning_PER_D3QN
06_CartPole-reinforcement-learning_PER_D3QN_CNN		06_CartPole-reinforcement-learning_PER_D3QN_CNN
07_Pong-reinforcement-learning_DQN_CNN		07_Pong-reinforcement-learning_DQN_CNN
08_Pong-v0_Policy_gradient		08_Pong-v0_Policy_gradient
09_Pong-v0_A2C		09_Pong-v0_A2C
10_Pong-v0_A3C		10_Pong-v0_A3C
11_Pong-v0_PPO		11_Pong-v0_PPO
BipedalWalker-v3_PPO		BipedalWalker-v3_PPO
LunarLander-v2_PPO		LunarLander-v2_PPO
LICENSE.md		LICENSE.md
README.md		README.md
requirements.txt		requirements.txt

Provide feedback