Connect 4 agent with Reinforcement Learning Connect4 게임을 강화학습을 이용해서 학습시키는 프로젝트 백엔드 및 안드로이드와 결합해서 어플로 구현시키는 것이 목표이다.
- 
agent_structure.py: 여러 agent의 구조 클래스 파일 
- 
config.json: 모델을 학습할 때 변경할 파라미터 파일 
- 
env.py: Connect 4 게임 환경을 구현한 클래스 
- 
evaluate_alphazero.py: 알파제로 및 알파고의 성능 측정을 위한 파일 
- 
evaluate_model.py: 그 외 모델의 성능 측정을 위한 파일 
- 
find_play_param_alphazero.py: 알파제로의 C, num_search 의 하이퍼파라미터 샘플링을 위한 파일 
- 
functions.py: 여러 함수들을 모아놓은 파일 
- 
model_comparison.py: 두 모델의 성능을 비교하기 위한 파일 
- 
models.py: 모델의 구조를 나타내는 파일 
- 
play_game.py 주어진 모델로 Connect 4를 플레이할 수 있는 파일 
- 
ReplayBuffer.py: DQN의 리플레이 버퍼를 이용하기 위한 클래스 파일 
- 
requirement.txt: 파일 실행을 위한 모듈 모음 
- 
test_alphago.py: 알파고 모델의 작동 테스트를 확인하기 위한 파일 
- 
test_alpha_model.py: 알파제로 모델의 작동 테스트를 확인하기 위한 파일 
- 
test_model.py: 그 외 모델의 작동 테스트를 확인하기 위한 파일 
- 
test_value_net.py: 알파고에 사용되는 value network 모델의 작동 테스트를 확인하기 위한 파일 
- 
train_AZ.py: 알파제로를 학습하는 파일 
- 
train.py: 그 외 모델을 학습하는 파일 
- 
train_PS.py: DQN 계열 모델의 하이퍼파라미터 샘플링을 하기 위한 파일 
- 
train_ValueNetwork.py: 알파고에 사용되는 Value network를 학습하는 파일 
- 
alphazero_new.py: agent_structure.py와 병합 
- 
AlphaZeroenv.py: env.py 와 병합 
- 
for_DJ.py: train_value_net.py 와 병합 
- 
json2excel.py: train_PS.py 와 병합 
- 
selfplay.py: train.py와 병합