#

trust-region-policy-optimization

Here are 15 public repositories matching this topic...

dodoseung / trpo-trust-region-policy-optimization-pytorch

The pytorch implemetation of trpo

deep-reinforcement-learning pytorch trpo trust-region-policy-optimization trpo-pytorch

Updated Mar 14, 2022
Python

waynemystir / deep-RL-bootcamp

My solutions to the labs from this bootcamp:

reinforcement-learning deep-reinforcement-learning q-learning policy-gradient trpo trust-region-policy-optimization natural-policy-gradient

Updated Mar 22, 2019
Jupyter Notebook

nslyubaykin / trpo_schedule_kl

Scheduling TRPO's KL Divergence Constraint

reinforcement-learning scheduling policy-gradient reinforcement-learning-algorithms continuous-control trpo kl-divergence trust-region-policy-optimization

Updated Aug 29, 2022
Jupyter Notebook

pompetzki / nes-npg

Benchmarking the Natural Gradient in Policy Gradient Methods and Evolution Strategies

benchmarking reinforcement-learning robotics reinforcement-learning-algorithms trust-region-policy-optimization natural-evolution-strategies natural-policy-gradient quanser-robots

Updated Jan 22, 2021
Python

kparnis3 / Final-Year-Project

Undergraduate Dissertation (University of Malta) 2020-2023 - 'Autonomous Drone Control using Reinforcement Learning''

drone deep-reinforcement-learning obstacle-avoidance deep-q-learning obstacle-detection airsim trust-region-policy-optimization double-deep-q-learning

Updated Dec 4, 2023
Jupyter Notebook

hcnoh / rl-collection-pytorch

A collection of Reinforcement Learning implementations with PyTorch

reinforcement-learning deep-learning gae deep-reinforcement-learning openai-gym pytorch policy-gradient continuous-control actor-critic trpo trust-region-policy-optimization proximal-policy-optimization ppo generalized-advantage-estimation

Updated Mar 22, 2022
Python

YixiongRen / Dynamics

works about solving nonlinear dynamic systems

dynamic blade nonlinear vibration frequency-domain newton-raphson turbine trust-region-policy-optimization micro-slip macro-slip aft derivate

Updated Jan 30, 2018
MATLAB

RLOpensource / spinning_up_kr

reinforcement-learning robotics ddpg sac trpo deep-deterministic-policy-gradient trust-region-policy-optimization proximal-policy-optimization ppo td3 soft-actor-critic ppo2 spinningup ou-noise

Updated Apr 2, 2019
Python

LihangLiu / CS395T-Numerical-Optimization

Course projects of CS395T Numerical Optimization, UT Austin

optimization trust-region-policy-optimization proximal-policy-optimization

Updated Dec 6, 2017
Python

funnydman / BFGS-NelderMead-TrustRegion

Python implementation of some numerical (optimization) methods

python machine-learning ai optimization machine-learning-algorithms mathematics numerical-methods numerical-optimization nelder-mead bfgs dogleg-method trust-region-policy-optimization trust-region dogleg-algorithm trust-region-dogleg-algorithm

Updated Feb 4, 2021
Python

GioStamoulos / BTC_RL_Trading_Bot

A trading bitcoin agent was created with deep reinforcement learning implementations.

deep-learning trading-bot deep-reinforcement-learning cryptocurrency reinforcement-learning-algorithms lstm-neural-networks multilayer-perceptron-network time-series-analysis trust-region-policy-optimization gym-environment proximal-policy-optimization actor-critic-algorithm stable-baselines

Updated Mar 28, 2022
Jupyter Notebook

Akella17 / Deep-Bayesian-Quadrature-Policy-Optimization

Official implementation of the AAAI 2021 paper Deep Bayesian Quadrature Policy Optimization.

reinforcement-learning deep-learning monte-carlo deep-reinforcement-learning pytorch policy-gradient gaussian-processes continuous-control actor-critic mujoco trust-region-policy-optimization advantage-actor-critic roboschool probablistic-numerics bayesian-quadrature natural-policy-gradient

Updated Feb 17, 2021
Python

MahanFathi / TRPO-TensorFlow

Trust Region Policy Optimization (TRPO) in pure TensorFlow

reinforcement-learning tensorflow policy-gradient trpo trust-region-policy-optimization

Updated Jun 7, 2018
Python

ikostrikov / pytorch-trpo

PyTorch implementation of Trust Region Policy Optimization

reinforcement-learning deep-learning deep-reinforcement-learning pytorch continuous-control trpo mujoco trust-region-policy-optimization

Updated Sep 13, 2018
Python

TianhongDai / reinforcement-learning-algorithms

This repository contains most of pytorch implementation based classic deep reinforcement learning algorithms, including - DQN, DDQN, Dueling Network, DDPG, SAC, A2C, PPO, TRPO. (More algorithms are still in progress)

algorithm deep-learning atari2600 flappy-bird deep-reinforcement-learning pytorch dqn ddpg sac actor-critic trpo dueling-dqn trust-region-policy-optimization proximal-policy-optimization ppo a2c soft-actor-critic

Updated Jan 16, 2021
Python

Improve this page

Add a description, image, and links to the trust-region-policy-optimization topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the trust-region-policy-optimization topic, visit your repo's landing page and select "manage topics."