ItsTanPI
diff --git a/‎data/log/training.log‎
Lines changed: 77 additions & 0 deletions b/‎data/log/training.log‎
Lines changed: 77 additions & 0 deletions
diff --git a/‎data/model/Best-2.zip‎
41.2 KB b/‎data/model/Best-2.zip‎
41.2 KB
diff --git a/‎data/model/Best.zip‎
3.19 KB b/‎data/model/Best.zip‎
3.19 KB
diff --git a/‎data/model/LilachV4-A2C-1.zip‎
105 KB b/‎data/model/LilachV4-A2C-1.zip‎
105 KB
diff --git a/‎src/Test.py‎
Lines changed: 33 additions & 7 deletions b/‎src/Test.py‎
Lines changed: 33 additions & 7 deletions
diff --git a/‎src/TrainingFieldParallel.py‎
Lines changed: 46 additions & 11 deletions b/‎src/TrainingFieldParallel.py‎
Lines changed: 46 additions & 11 deletions
diff --git a/‎src/__pycache__/car.cpython-312.pyc‎
0 Bytes b/‎src/__pycache__/car.cpython-312.pyc‎
0 Bytes
diff --git a/‎src/__pycache__/model.cpython-312.pyc‎
852 Bytes b/‎src/__pycache__/model.cpython-312.pyc‎
852 Bytes
diff --git a/‎src/__pycache__/physics.cpython-312.pyc‎
-5 Bytes b/‎src/__pycache__/physics.cpython-312.pyc‎
-5 Bytes
diff --git a/‎src/__pycache__/vectorMath.cpython-312.pyc‎
26 Bytes b/‎src/__pycache__/vectorMath.cpython-312.pyc‎
26 Bytes
@@ -637,3 +637,80 @@ INFO:root:Model saved as LilachV4-1.zip for episode 1 with 240000 steps at 2024-
 INFO:root:Loaded existing model.
 INFO:root:Model saved as LilachV4-1.zip for episode 1 with 240000 steps at 2024-10-14 23:19:41
 INFO:root:Model saved as LilachV4-1.zip for episode 1 with 240000 steps at 2024-10-15 22:49:12
+INFO:root:Model saved as LilachV4-1.zip for episode 1 with 100000 steps at 2024-10-15 23:11:39
+INFO:root:Model saved as LilachV4-1.zip for episode 1 with 100000 steps at 2024-10-15 23:21:07
+INFO:root:Loaded existing model.
+INFO:root:Model saved as LilachV4-1.zip for episode 1 with 100000 steps at 2024-10-15 23:31:26
+INFO:root:Loaded existing model.
+INFO:root:Model saved as LilachV4-1.zip for episode 1 with 100000 steps at 2024-10-15 23:40:48
+INFO:root:Loaded existing model.
+INFO:root:Model saved as LilachV4-1.zip for episode 1 with 1000000 steps at 2024-10-16 00:35:39
+INFO:root:Model saved as LilachV4-2.zip for episode 2 with 1000000 steps at 2024-10-16 01:01:07
+INFO:root:Model saved as LilachV4-3.zip for episode 3 with 1000000 steps at 2024-10-16 01:26:34
+INFO:root:Model saved as LilachV4-4.zip for episode 4 with 1000000 steps at 2024-10-16 01:51:48
+INFO:root:Model saved as LilachV4-5.zip for episode 5 with 1000000 steps at 2024-10-16 02:17:10
+INFO:root:Model saved as LilachV4-6.zip for episode 6 with 1000000 steps at 2024-10-16 02:42:36
+INFO:root:Model saved as LilachV4-7.zip for episode 7 with 1000000 steps at 2024-10-16 03:08:05
+INFO:root:Model saved as LilachV4-8.zip for episode 8 with 1000000 steps at 2024-10-16 03:33:34
+INFO:root:Model saved as LilachV4-9.zip for episode 9 with 1000000 steps at 2024-10-16 03:58:54
+INFO:root:Model saved as LilachV4-10.zip for episode 10 with 1000000 steps at 2024-10-16 04:24:25
+INFO:root:Model saved as LilachV4-11.zip for episode 11 with 1000000 steps at 2024-10-16 04:49:50
+INFO:root:Model saved as LilachV4-12.zip for episode 12 with 1000000 steps at 2024-10-16 05:15:14
+INFO:root:Model saved as LilachV4-13.zip for episode 13 with 1000000 steps at 2024-10-16 05:40:31
+INFO:root:Model saved as LilachV4-14.zip for episode 14 with 1000000 steps at 2024-10-16 06:05:50
+INFO:root:Model saved as LilachV4-15.zip for episode 15 with 1000000 steps at 2024-10-16 06:31:12
+INFO:root:Loaded existing model.
+INFO:root:Model saved as LilachV4-30.zip for episode 1 with 1000000 steps at 2024-10-16 07:21:39
+INFO:root:Model saved as LilachV4-30.zip for episode 1 with 100000 steps at 2024-10-16 12:11:37
+INFO:root:Model saved as LilachV4-30.zip for episode 1 with 100000 steps at 2024-10-16 12:25:52
+INFO:root:Model saved as LilachV4-30.zip for episode 1 with 80000 steps at 2024-10-16 12:32:14
+INFO:root:Model saved as LilachV4-1.zip for episode 1 with 80000 steps at 2024-10-16 12:50:59
+INFO:root:Loaded existing model.
+INFO:root:Model saved as LilachV4-1.zip for episode 1 with 200000 steps at 2024-10-16 13:10:41
+INFO:root:Loaded existing model.
+INFO:root:Model saved as LilachV4-1.zip for episode 1 with 100000 steps at 2024-10-16 13:30:51
+INFO:root:Loaded existing model.
+INFO:root:Model saved as LilachV4-1.zip for episode 1 with 100000 steps at 2024-10-16 13:42:04
+INFO:root:Loaded existing model.
+INFO:root:Model saved as LilachV4-1.zip for episode 1 with 100000 steps at 2024-10-16 13:50:36
+INFO:root:Loaded existing model.
+INFO:root:Model saved as LilachV4-1.zip for episode 1 with 100000 steps at 2024-10-16 18:57:15
+INFO:root:Loaded existing model.
+INFO:root:Model saved as LilachV4-1.zip for episode 1 with 200000 steps at 2024-10-16 19:06:49
+INFO:root:Loaded existing model.
+INFO:root:Model saved as LilachV4-1.zip for episode 1 with 200000 steps at 2024-10-16 19:17:57
+INFO:root:Loaded existing model.
+INFO:root:Model saved as LilachV4-1.zip for episode 1 with 200000 steps at 2024-10-16 19:24:30
+INFO:root:Loaded existing model.
+INFO:root:Model saved as LilachV4-1.zip for episode 1 with 200000 steps at 2024-10-16 19:32:12
+INFO:root:Loaded existing model.
+INFO:root:Model saved as LilachV4-1.zip for episode 1 with 200000 steps at 2024-10-16 19:42:03
+INFO:root:Loaded existing model.
+INFO:root:Model saved as LilachV4-1.zip for episode 1 with 200000 steps at 2024-10-16 20:00:37
+INFO:root:Loaded existing model.
+INFO:root:Model saved as LilachV4-1.zip for episode 1 with 200000 steps at 2024-10-16 20:27:10
+INFO:root:Loaded existing model.
+INFO:root:Loaded existing model.
+INFO:root:Model saved as LilachV4-1.zip for episode 1 with 200000 steps at 2024-10-16 20:50:53
+INFO:root:Loaded existing model.
+INFO:root:Model saved as LilachV4-1.zip for episode 1 with 200000 steps at 2024-10-16 21:20:49
+INFO:root:Loaded existing model.
+INFO:root:Model saved as LilachV4-1.zip for episode 1 with 200000 steps at 2024-10-16 21:51:04
+INFO:root:Model saved as LilachV4-A2C-1.zip for episode 1 with 200000 steps at 2024-10-16 22:22:10
+INFO:root:Loaded existing model.
+INFO:root:Loaded existing model.
+INFO:root:Loaded existing model.
+INFO:root:Model saved as LilachV4-1.zip for episode 1 with 200000 steps at 2024-10-17 12:31:03
+INFO:root:Model saved as LilachV4-1.zip for episode 1 with 200000 steps at 2024-10-17 12:51:27
+INFO:root:Model saved as LilachV4-1.zip for episode 1 with 100000 steps at 2024-10-17 13:05:08
+INFO:root:Model saved as LilachV4-1.zip for episode 1 with 100000 steps at 2024-10-17 20:44:09
+INFO:root:Model saved as LilachV4-1.zip for episode 1 with 100000 steps at 2024-10-17 20:52:00
+INFO:root:Model saved as LilachV4-1.zip for episode 1 with 200000 steps at 2024-10-17 21:01:14
+INFO:root:Model saved as LilachV4-1.zip for episode 1 with 200000 steps at 2024-10-17 21:08:34
+INFO:root:Model saved as LilachV4-1.zip for episode 1 with 200000 steps at 2024-10-17 21:22:14
+INFO:root:Model saved as LilachV4-1.zip for episode 1 with 200000 steps at 2024-10-17 21:33:04
+INFO:root:Model saved as LilachV4-1.zip for episode 1 with 200000 steps at 2024-10-17 21:42:32
+INFO:root:Model saved as LilachV4-1.zip for episode 1 with 20000 steps at 2024-10-17 21:50:15
+INFO:root:Model saved as LilachV4-1.zip for episode 1 with 200000 steps at 2024-10-17 22:18:36
+INFO:root:Model saved as LilachV4-1.zip for episode 1 with 200000 steps at 2024-10-17 22:31:08
+INFO:root:Model saved as LilachV4-1.zip for episode 1 with 200000 steps at 2024-10-17 22:40:44
@@ -6,14 +6,42 @@
 
 env = LilachV2()
 
-model_path = r'data\model\Best1.zip'
+def print_hyperparameters(model):
+    print("==== PPO Hyperparameters ====")
+    print("Learning Rate:", model.learning_rate)
+    print("Gamma (Discount Factor):", model.gamma)
+    print("Number of Environments:", model.n_envs)
+    print("Entropy Coefficient:", model.ent_coef)
+    print("Clip Range:", model.clip_range)
+    print("GAE Lambda:", model.gae_lambda)
+    print("Number of Epochs:", model.n_epochs)
+    print("Max Gradient Norm:", model.max_grad_norm)
+    print("Number of Steps per Rollout:", model.n_steps)
+    print("Batch Size:", model.batch_size)
+    print("Policy Architecture (Hidden Layers):", model.policy_kwargs)
+    print("Device (CPU or GPU):", model.device)
+    print("=============================")
+
+model_path = r'data\model\LilachV4-1.zip'
 if os.path.isfile(model_path):
-    model = PPO.load(model_path, env=env, device="cuda")
+    model = PPO.load(model_path, env = env, verbose=1, device="cuda",
+                          learning_rate = 0.0001,
+                          batch_size=256,
+                          n_steps=4096,
+                          clip_range=0.05,
+                          ent_coef=0.001,
+                          gae_lambda=0.99,
+                          n_epochs=30,
+                          max_grad_norm=0.1,
+                          policy_kwargs = dict(net_arch=[128, 64, 32])
+                          )
     print("Loaded existing model.")
 else:
-    model = PPO("MlpPolicy", env, verbose=1, device="cuda", gamma=0.5)
+    model = PPO("MlpPolicy", env, verbose=1, device="cuda")
     print("Loaded new model.")
 
+
+print_hyperparameters(model)
 """model = PPO(
     'MlpPolicy',
     env,
@@ -47,7 +75,7 @@
                     type = "H"
                 elif (type == "H"):
                     type = "A"
-                else:
+                else:   
                     type = "A"
 
 
@@ -57,9 +85,7 @@
 
     #log_data(log_path, obs, action, reward, info)
 
-    if info["Distance"] > 1500:
-        env.reset()
     if done:
         obs, info = env.reset()
 
-    clock.tick(60)
+    clock.tick(60)  
@@ -1,5 +1,5 @@
 
-from stable_baselines3 import PPO
+from stable_baselines3 import PPO, A2C
 import logging
 import torch
 from stable_baselines3.common.vec_env import SubprocVecEnv
@@ -21,35 +21,70 @@ def _init():
         return LilachV2()
     return _init
 
+def print_hyperparameters(model):
+    print("==== PPO Hyperparameters ====")
+    print("Learning Rate:", model.learning_rate)
+    print("Gamma (Discount Factor):", model.gamma)
+    print("Number of Environments:", model.n_envs)
+    print("Entropy Coefficient:", model.ent_coef)
+    print("Clip Range:", model.clip_range)
+    print("GAE Lambda:", model.gae_lambda)
+    print("Number of Epochs:", model.n_epochs)
+    print("Max Gradient Norm:", model.max_grad_norm)
+    print("Number of Steps per Rollout:", model.n_steps)
+    print("Batch Size:", model.batch_size)
+    print("Policy Architecture (Hidden Layers):", model.policy_kwargs)
+    print("Device (CPU or GPU):", model.device)
+    print("=============================")
 
 if __name__ == '__main__':    
     n_agents = 20
     env = SubprocVecEnv([make_env() for _ in range(n_agents)])
 
     model_path = r'data\model\LilachV4-1.zip'
     if os.path.isfile(model_path):
-        model = PPO.load(model_path, env=env, device="cuda", n_steps=3072, learning_rate = 0.001, batch_size=128, ent_coef=0.001)
-        logging.info("Loaded existing model.")
-        print("Loaded existing model.")
+        model = PPO.load(model_path, env = env, verbose=1, device="cuda",
+                          learning_rate = 0.0001,
+                          batch_size=256,
+                          n_steps=4096,
+                          clip_range=0.05,
+                          ent_coef=0.001,
+                          gae_lambda=0.99,
+                          n_epochs=30,
+                          max_grad_norm=0.1,
+                          policy_kwargs = dict(net_arch=[64, 32, 16])
+                          )
     else:
-        model = PPO("MlpPolicy", env, verbose=1, device="cuda", n_steps=3072, learning_rate = 0.001, batch_size=128, ent_coef=0.001)
+        model = PPO("MlpPolicy", env=env, verbose=1, device="cuda",
+                          learning_rate = 0.0001,
+                          batch_size=256,
+                          n_steps=4096,
+                          clip_range=0.05,
+                          ent_coef=0.001,
+                          gae_lambda=0.99,
+                          n_epochs=30,
+                          max_grad_norm=0.1,
+                          policy_kwargs = dict(net_arch=[64, 32, 16])
+                          )
         print("Loaded new model.")
     env.reset()
 
-    """model = PPO(
-    'MlpPolicy',
+    print_hyperparameters(model)
+    
+    """
+    model = PPO
+    ('MlpPolicy',
     env,
-    learning_rate=0.001,
+    learning_rate=0.00,
     ent_coef=0.01,
     gamma=0.99,
     gae_lambda=0.95,
     n_epochs=10,
     batch_size=64,
     clip_range=0.2,
     max_grad_norm=0.5,
-    verbose=1
-)"""
-    total_timesteps_per_episode = 100000  # Set timesteps per episode as needed
+    verbose=1)"""
+    total_timesteps_per_episode = 200000  # Set timesteps per episode as needed
     num_episodes = 1
 
     for episode in range(num_episodes):