Connect 4 reinforcement learning agent

The first component, the self-learning module, uses deep reinforcement learning to train a residual CNN to play connect 4 on an 8x8 board.

The second component, the connect_4_AB module, uses an alpha-beta search, bit boards, and a simple evaluation function (win/loss).

Usage

cd connect_4_AB
make playable
./c4_AB_playable

cd connect_4_AB
make combo
cp c4_AB_combo ../self-learning

cd self-learning
./main.py --mode train

cd self-learning
./main.py --mode play --opponent {NN, NN_AB, AB}

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
connect_4_AB		connect_4_AB
self-learning		self-learning
README.md		README.md