CS234: Deep Reinforcement Learning Stanford: Programming assignments solutions

This reposity contains my solutions for the programming assignments of the CS234: Reinforcement Learning Winter 2022 course offered by Stanford.

Assignment 1: Tabular MDP planning

Implementing the REINFORCE policy gradient algorithm to train a Deep Neural Network to play OpenAI Gym environments

Policy: Code for Categorical and Gaussian Policy
Policy gradient: Implementing the REINFORCE policy gradient algorithm.
Baseline Network: Implementing the baseline network to use the REINFORCE algorithm with baseline

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
Assignment 1		Assignment 1
Assignment 2		Assignment 2
Assignment 3		Assignment 3
README.md		README.md