proximal-policy-optimization

You can see a reference for Books, Articles, Courses and Educational Materials in this field. Implementation of Reinforcement Learning Algorithms and Environments. Python, OpenAI Gym, Tensorflow.

machine-learning reinforcement-learning deep-learning atari2600 deep-reinforcement-learning artificial-intelligence dqn policy-gradient ddqn deeprl deep-rl proximal-policy-optimization

Updated Aug 22, 2022
Jupyter Notebook

OgnjenBaucal / Ball-Balancing-AI

Star

Balancing a Ball with Reinforcement Learning

machine-learning reinforcement-learning ai deep-reinforcement-learning pytorch proximal-policy-optimization

Updated Aug 29, 2024
Python

jacobyxu / Crawler_using_PPO

Star

Implement PPO to solve Crawler problem in Unity

deep-reinforcement-learning python3 pytorch continuous-control actor-critic proximal-policy-optimization

Updated Dec 8, 2022
Python

tomasspangelo / proximal-policy-optimization

Star

An implementation from the state-of-the-art family of reinforcement learning algorithms Proximal Policy Optimization using normalized Generalized Advantage Estimation and optional batch mode training. The loss function incorporates an entropy bonus.

python machine-learning reinforcement-learning entropy deep-learning neural-network optimization gae pytorch rl actor-critic proximal-policy-optimization ppo open-ai open-ai-gym generalized-advantage-estimation ppo-pytorch

Updated Dec 26, 2022
Python

KaufmannLukas / ds-ultimate-tic-tac-toe

Star

XOXO² - Use Reinforcement Learning to train agent to play U_T-T-T.

machine-learning reinforcement-learning gaming mcts neural-networks web-interface monte-carlo-tree-search ultimate-tic-tac-toe agent-based-simulation proximal-policy-optimization ppo mcts-algorithm spicedacademy

Updated Jan 9, 2024
Jupyter Notebook

blahBlahhhJ / ProjectProcgen

Star

A pytorch project to easily run experiments on OpenAI's Procgen Benchmark

reinforcement-learning pytorch proximal-policy-optimization

Updated May 20, 2021
Python

satyampurwar / large-language-models

Star

Unlocking the Power of Generative AI: In-Context Learning, Instruction Fine-Tuning and Reinforcement Learning Fine-Tuning.

memory-management bert conda-environment kl-divergence encoder-decoder-model proximal-policy-optimization encoder-model storage-management megacmd model-quantization large-language-models prompt-engineering generative-ai reinforcement-learning-from-human-feedback flan-t5 few-shot-prompting low-rank-adaptation reinforcement-learning-from-ai-feedback peft-fine-tuning-llm instruction-fine-tuning

Updated Oct 25, 2024
Jupyter Notebook

sophiaas / rlbase

Star

Modular Deep RL infrastructure in PyTorch

reinforcement-learning deep-reinforcement-learning policy-gradient hierarchical-reinforcement-learning pytorch-rl proximal-policy-optimization ppo a2c option-critic

Updated Jul 25, 2024
Python

sunoh-kim / deep-reinforcement-learning

Star

This repository contains my assignment solutions for the Deep Reinforcement Learning course (430.729_003) offered by Seoul National University (Spring 2020).

deep-reinforcement-learning imitation-learning deep-q-learning deep-deterministic-policy-gradient proximal-policy-optimization

Updated Apr 10, 2022
Jupyter Notebook

NikosNtigas / Rock-Paper-Scissors-RL

Star

A custom Gym environment for a Rock-Paper-Scissors game, where a reinforcement learning agent and a CNN model are trained, evaluated, and compared using Ray RLlib and TensorFlow.

reinforcement-learning raylib supervised-learning rock-paper-scissors gymnasium proximal-policy-optimization

Updated Jan 5, 2024
Jupyter Notebook

sarahalshareeda / Task-Offloading-PPO-DRL

Star

Cognitive Generative Intelligent Task Offloading for Digital Twins of Vehicular Networks This repository contains the code and resources for the implementation of cognitive generative intelligent task offloading in digital twins for vehicular networks.

deep-reinforcement-learning vehicular-networks proximal-policy-optimization task-offloading generative-ai cognitive-digital-twins