DL CookBook Progress

[▓▓▓░░░░░░░░░░░░░░] 10.86% (20/184)

Neural Network Architectures

Basic Architectures (4/4)

MLP
CNN
ResNet
DenseNet

Recurrent Networks (5/5)

Auto-Encoders (4/4)

Sparse
Variational
Contractive
VQ-VAE

Transformers (7/11)

Diffusion Models (0/4)

DDPM
DDIM
Latent Diffusion
Large Language Diffusion

State Space Models (0/3)

Mamba
S4
H3

Physics-Informed Neural Networks (0/5)

Graph Neural Networks (0/5)

Generative Adversarial Networks (0/5)

Energy-Based Models (0/4)

Restricted Boltzmann Machines
Deep Belief Networks
Deep Energy Networks
Normalizing Flows

Hyperbolic Networks (0/5)

Specialized Architectures (0/8)

Reinforcement Learning Algorithms

Value-Based Methods (0/7)

Policy Gradient Methods (0/8)

Asynchronous Advantage Actor-Critic (A3C)
Advantage Actor-Critic (A2C)
Proximal Policy Optimization (PPO)
Trust Region Policy Optimization (TRPO)
Deep Deterministic Policy Gradient (DDPG)
Twin Delayed DDPG (TD3)
Soft Actor-Critic (SAC)
Group Related Policy Optimization (GRPO)

Model-Based Methods (0/6)

Multi-Agent RL (0/4)

Multi-Agent DDPG (MADDPG)
Counter-Factual Multi-Agent (COMA)
Multi-Agent PPO (MAPPO)
Multi-Agent SAC (MASAC)

Exploration Strategies (0/4)

Hindsight Experience Replay (HER)
Random Network Distillation (RND)
Never Give Up (NGU)
Go-Explore

Game-Playing and Planning (0/4)

AlphaZero
MuZero
AlphaGo
Monte Carlo Tree Search (MCTS)

Offline RL (0/4)

Conservative Q-Learning (CQL)
Behavior Regularized Actor Critic (BRAC)
Implicit Q-Learning (IQL)
Decision Transformer

Meta-RL (0/4)

RL^2
MAML for RL
PEARL
ProMP

Hierarchical RL (0/4)

Option-Critic
Hierarchical Actor-Critic (HAC)
HIRO
FUN

Optimization Algorithms

First-Order Methods (0/14)

Large-Scale/Distributed Training (0/5)

LARS (Layer-wise Adaptive Rate Scaling)
LAMB (Layer-wise Adaptive Moments for Batch training)
Shampoo
SOAP
FTRL (Follow The Regularized Leader)

Recent Innovations (0/7)

Geometric Methods (0/3)

Reimann SGD
Natural Gradient Descent
Mirror Descent

Adaptive Learning Rate Methods (0/4)

Cyclical Learning Rates
One Cycle Policy
Cosine Annealing
SGDR (Stochastic Gradient Descent with Restarts)

Hybrid Methods (0/5)

Specialized Optimizers (0/6)

Tokenization

Tokenizing Techniques (0/7)

Distributed Training

Distributed Training (0/14)

Architectures Excluded

Neural Turing Machines
Differentiable Neural Computers
Memory-Augmented Neural Networks
Beta Variational Auto-encoders
Convolutional Auto-encoders
Conditional Auto-encoders
Vision Transformers
Performer
Reformer
Longformer
FNet
Routing Transformers
Perceiver/Perceiver IO
SinkFormers

Name		Name	Last commit message	Last commit date
Latest commit History 49 Commits
archetypes		archetypes
assets		assets
content		content
layouts		layouts
resources/_gen/assets/css/css		resources/_gen/assets/css/css
static/images		static/images
.gitignore		.gitignore
.hugo_build.lock		.hugo_build.lock
README.md		README.md
hugo.toml		hugo.toml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

DL CookBook Progress

Neural Network Architectures

Reinforcement Learning Algorithms

Optimization Algorithms

Tokenization

Distributed Training

Architectures Excluded

About

Uh oh!

Releases

Packages

Languages

astledsa/DL-Cookbook

Folders and files

Latest commit

History

Repository files navigation

DL CookBook Progress

Neural Network Architectures

Reinforcement Learning Algorithms

Optimization Algorithms

Tokenization

Distributed Training

Architectures Excluded

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages