PaddlePaddle · qizhaoaoe · Mar 24, 2023 · Mar 26, 2023 · Mar 28, 2023
diff --git a/configs/byol/byol_r50_IM.yaml b/configs/byol/byol_r50_IM.yaml
@@ -1,5 +1,5 @@
 epochs: 300
-use_byol_iters: True
+use_simclr_iters: True
 total_images: 1281167
 global_batch_size: 4096
 output_dir: output_dir
@@ -84,12 +84,13 @@ dataloader:
 
 
 lr_scheduler:
-  name: CosineWarmup
-  learning_rate: 4.8
-  T_max: 93835
-  warmup_steps: 3127
-  start_lr: 0.0001
-  end_lr: 4.8
+  name: simclrCosineWarmup
+  learning_rate_scaling: linear
+  total_images: 1281167
+  warmup_epochs: 10
+  start_lr: 0
+  end_lr: 0.3
+  T_max: 300
 
 
 optimizer:

diff --git a/configs/simclr/simclr_r50_IM.yaml b/configs/simclr/simclr_r50_IM.yaml
@@ -2,6 +2,7 @@ epochs: 100
 use_simclr_iters: True
 global_batch_size: 4096
 output_dir: output_dir
+device: gpu
 
 model:
   name: SimCLR
@@ -21,7 +22,9 @@ model:
 
 dataloader:
   train:
-    num_workers: 6
+    loader:
+      num_workers: 4
+      use_shared_memory: True
     sampler:
       batch_size: 32
       shuffle: true
@@ -83,9 +86,11 @@ dataloader:
           std: [0.229, 0.224, 0.225]
 
   val:
-    num_workers: 4
+    loader:
+      num_workers: 4
+      use_shared_memory: True
     sampler:
-      batch_size: 512
+      batch_size: 256
       shuffle: false
       drop_last: false
     dataset:
@@ -105,18 +110,18 @@ dataloader:
 
 lr_scheduler:
   name: simclrCosineWarmup
-  learning_rate_scaling: sqrt
+  learning_rate_scaling: linear
   total_images: 1281167
   warmup_epochs: 10
   start_lr: 0
-  end_lr: 1.0
+  end_lr: 0.3
   T_max: 200
 
 
 optimizer:
   name: LarsMomentumOptimizer
   momentum: 0.9
-  lars_weight_decay: 0.0001
+  lars_weight_decay: 1e-6
   exclude_from_weight_decay: ["scale","offset",".bias"]
 
 log_config:

diff --git a/passl/engine/trainer.py b/passl/engine/trainer.py
@@ -145,21 +145,17 @@ def __init__(self, cfg):
         self.train_dataloader, self.mixup_fn = build_dataloader(
             cfg.dataloader.train, self.device)
         self.iters_per_epoch = len(self.train_dataloader)
-
+        self.batch_size = cfg.dataloader.train.sampler.batch_size
+        self.global_batch_size = self.batch_size * dist.get_world_size()
         # use byol iters
         if self.use_byol_iters:
-            self.global_batch_size = cfg.global_batch_size
             self.byol_total_iters = self.epochs * cfg.total_images // self.global_batch_size
-
-        if self.use_byol_iters:
             self.lr_scheduler = build_lr_scheduler(cfg.lr_scheduler,
                                                    self.byol_total_iters)
         elif self.use_simclr_iters:
-            self.batch_size = cfg.dataloader.train.sampler.batch_size
-            self.global_batch_size = cfg.global_batch_size
             self.epochs = cfg.epochs
             self.lr_scheduler = build_lr_scheduler_simclr(
-                cfg.lr_scheduler, self.iters_per_epoch, self.batch_size * 8,
+                cfg.lr_scheduler, self.iters_per_epoch, self.global_batch_size,
                 cfg.epochs, self.current_iter)
         else:
             self.lr_scheduler = build_lr_scheduler(cfg.lr_scheduler,
@@ -224,7 +220,7 @@ def __init__(self, cfg):
         self.add_train_hooks()
         self.add_custom_hooks()
         self.hooks = sorted(self.hooks, key=lambda x: x.priority)
-
+        print("hooks: ", self.hooks)
         if self.epochs:
             self.total_iters = self.epochs * self.iters_per_epoch
             self.by_epoch = True