add MetaPhys

chenyouxin113 · Aug 9, 2021 · 04f9221 · 04f9221
1 parent 2d98f11
commit 04f9221
Show file tree

Hide file tree

Showing 11 changed files with 357 additions and 61 deletions.
diff --git a/Meta_main.py b/Meta_main.py
@@ -0,0 +1,248 @@
+import datetime
+import json
+import time
+
+import numpy as np
+import torch
+from torch.utils.data import DataLoader, random_split
+from torchmeta.utils.data import BatchMetaDataLoader
+from tqdm import tqdm
+import higher
+
+from dataset.dataset_loader import dataset_loader
+from log import log_info_time
+from loss import loss_fn
+from models import is_model_support, get_model, summary
+from optim import optimizers
+from torch.optim import lr_scheduler
+from utils.dataset_preprocess import preprocessing,Meta_preprocessing
+from utils.funcs import normalize, plot_graph, detrend
+
+with open('meta_params.json') as f:
+    jsonObject = json.load(f)
+    __PREPROCESSING__ = jsonObject.get("__PREPROCESSING__")
+    __TIME__ = jsonObject.get("__TIME__")
+    __MODEL_SUMMARY__ = jsonObject.get("__MODEL_SUMMARY__")
+    options = jsonObject.get("options")
+    params = jsonObject.get("params")
+    hyper_params = jsonObject.get("hyper_params")
+    model_params = jsonObject.get("model_params")
+    meta_params = jsonObject.get("meta_params")
+#
+"""
+Check Model Support
+"""
+is_model_support(model_params["name"], model_params["name_comment"])
+'''
+Generate preprocessed data hpy file
+'''
+if __PREPROCESSING__:
+    if __TIME__:
+        start_time = time.time()
+
+    Meta_preprocessing(save_root_path=params["save_root_path"],
+                  model_name=model_params["name"],
+                  data_root_path=params["data_root_path"],
+                  dataset_name=params["dataset_name"])
+
+    if __TIME__:
+        log_info_time("preprocessing time \t:", datetime.timedelta(seconds=time.time() - start_time))
+
+'''
+Load dataset before using Torch DataLoader
+'''
+if __TIME__:
+    start_time = time.time()
+
+dataset = dataset_loader(save_root_path=params["save_root_path"],
+                         model_name=model_params["name"],
+                         dataset_name=params["dataset_name"],
+                         option="train",
+
+                         num_shots= meta_params["num_shots"],
+                         num_test_shots = meta_params["num_test_shots"],
+                         fs = meta_params["fs"],
+                         unsupervised = meta_params["unsupervised"]
+                         )
+
+train_dataset, validation_dataset = random_split(dataset,
+                                                 [int(np.floor(
+                                                     len(dataset) * params["validation_ratio"])),
+                                                     int(np.ceil(
+                                                         len(dataset) * (1 - params["validation_ratio"])))]
+                                                 )
+if __TIME__:
+    log_info_time("load train hpy time \t: ", datetime.timedelta(seconds=time.time() - start_time))
+
+if __TIME__:
+    start_time = time.time()
+test_dataset = dataset_loader(save_root_path=params["save_root_path"],
+                              model_name=model_params["name"],
+                              dataset_name=params["dataset_name"],
+                              option="test",
+
+                              num_shots=meta_params["num_shots"],
+                              num_test_shots=meta_params["num_test_shots"],
+                              fs=meta_params["fs"],
+                              unsupervised=meta_params["unsupervised"]
+                              )
+if __TIME__:
+    log_info_time("load test hpy time \t: ", datetime.timedelta(seconds=time.time() - start_time))
+
+'''
+    Call dataloader for iterate dataset
+'''
+if __TIME__:
+    start_time = time.time()
+
+train_loader = BatchMetaDataLoader(train_dataset, batch_size=params["train_batch_size"],
+                                       shuffle=params["train_shuffle"])
+validation_loader = BatchMetaDataLoader(validation_dataset, batch_size=params["train_batch_size"],
+                               shuffle=params["train_shuffle"])
+test_loader = BatchMetaDataLoader(test_dataset, batch_size=params["test_batch_size"],
+                                   shuffle=params["test_shuffle"])
+
+if __TIME__:
+    log_info_time("generate dataloader time \t: ", datetime.timedelta(seconds=time.time() - start_time))
+'''
+Setting Learning Model
+'''
+if __TIME__:
+    start_time = time.time()
+model = get_model(model_params["name"])
+
+if meta_params["pre_trained"] ==1:
+    print('Using pre-trained on all ALL AFRL!')
+    model.load_state_dict(torch.load('./checkpoints/AFRL_pretrained/meta_pretrained_all_AFRL.pth'))
+else:
+    print('Not using any pretrained models')
+
+if torch.cuda.is_available():
+    # os.environ["CUDA_VISIBLE_DEVICES"] = '0, 1, 2, 3, 4, 5, 6, 7, 8, 9'
+    # TODO: implement parallel training
+    # if options["parallel_criterion"] :
+    #     print(options["parallel_criterion_comment"])
+    #     model = DataParallelModel(model, device_ids=[0, 1, 2])
+    # else:
+    #     model = DataParallel(model, output_device=0)
+    device = torch.device('cuda:9')
+    model.to(device)
+else:
+    model = model.to('cpu')
+
+if __MODEL_SUMMARY__:
+    summary(model,model_params["name"])
+
+if __TIME__:
+    log_info_time("model initialize time \t: ", datetime.timedelta(seconds=time.time() - start_time))
+
+'''
+Setting Loss Function
+'''
+if __TIME__:
+    start_time = time.time()
+criterion = loss_fn(hyper_params["loss_fn"])
+inner_criterion = loss_fn(meta_params["inner_loss"])
+outer_criterion = loss_fn(meta_params["outer_loss"])
+
+if __TIME__:
+    log_info_time("setting loss func time \t: ", datetime.timedelta(seconds=time.time() - start_time))
+'''
+Setting Optimizer
+'''
+if __TIME__:
+    start_time = time.time()
+optimizer = optimizers(model.parameters(), hyper_params["learning_rate"], hyper_params["optimizer"])
+inner_optimizer = optimizers(model.parameters(), hyper_params["inner_learning_rate"], hyper_params["inner_optimizer"])
+scheduler = lr_scheduler.ExponentialLR(optimizer,gamma=0.99)
+if __TIME__:
+    log_info_time("setting optimizer time \t: ", datetime.timedelta(seconds=time.time() - start_time))
+
+'''
+Model Training Step
+'''
+
+min_val_loss = 100.0
+
+for epoch in range(hyper_params["epochs"]):
+    if __TIME__ and epoch == 0:
+        start_time = time.time()
+    with tqdm(train_loader, desc="Train ", total=len(train_loader)) as tepoch:
+        model.train()
+        for batch_idx, batch in enumerate(tepoch):
+            tepoch.set_description(f"Train Epoch {epoch}")
+            outer_loss = 0.0
+
+            batch['train'][0] = batch['train'][0].view(params["train_batch_size"], -1, 6, 36, 36)
+            batch['test'][0] = batch['test'][0].view(params["train_batch_size"], -1, 6, 36, 36)
+            batch['train'][1] = batch['train'][1].view(params["train_batch_size"], -1, 1)
+            batch['test'][1] = batch['test'][1].view(params["train_batch_size"], -1, 1)
+
+            inputs, targets = batch['train']
+            inputs = inputs.to(device=device)
+            targets = targets.to(device=device)
+
+            test_inputs, test_targets= batch['test']
+            test_inputs = test_inputs.to(device=device)
+            test_targets = test_targets.to(device=device)
+
+            for task_idx, (input, target, test_input, test_target) in enumerate(zip(inputs, targets, test_inputs, test_targets)):
+                with higher.innerloop_ctx(model, inner_optimizer, copy_initial_weights=False) as (fmodel, diffopt):
+                    for step in range(meta_params["num_adapt_steps"]):
+                        train_logit = fmodel(input)
+                        inner_loss = inner_criterion(train_logit, target)
+                        diffopt.step(inner_loss)
+                    test_logit = fmodel(test_input)
+                    outer_loss += outer_criterion(test_logit, test_target)
+
+            optimizer.zero_grad()
+            maml_loss = outer_loss / len(validation_loader)
+            maml_loss.backward()
+            optimizer.step()
+            tepoch.set_postfix(loss=outer_loss / params["train_batch_size"])
+    if __TIME__ and epoch == 0:
+        log_info_time("1 epoch training time \t: ", datetime.timedelta(seconds=time.time() - start_time))
+
+    with tqdm(validation_loader, desc="Validation ", total=len(validation_loader)) as tepoch:
+        model.train()
+        #running_loss = 0.0
+        #with torch.no_grad():
+        for batch_idx, batch in enumerate(tepoch):
+            tepoch.set_description(f"Validation")
+            outer_loss = 0.0
+
+            batch['train'][0] = batch['train'][0].view(params["train_batch_size"], -1, 6, 36, 36)
+            batch['test'][0] = batch['test'][0].view(params["train_batch_size"], -1, 6, 36, 36)
+            batch['train'][1] = batch['train'][1].view(params["train_batch_size"], -1, 1)
+            batch['test'][1] = batch['test'][1].view(params["train_batch_size"], -1, 1)
+
+            inputs, targets = batch['train']
+
+            inputs = inputs.to(device=device)
+            targets = targets.to(device=device)
+
+            test_inputs, test_targets = batch['test']
+
+            for task_idx, (input, target, test_input, test_target) in enumerate(zip(inputs, targets, test_inputs, test_targets)):
+                with higher.innerloop_ctx(model, inner_optimizer, copy_initial_weights=False) as (fmodel, diffopt):
+                    for step in range(meta_params["num_adapt_steps"]):
+                        train_logit = fmodel(input)
+                        inner_loss = inner_criterion(train_logit, target)
+                        diffopt.step(inner_loss)
+                    test_data_loader = DataLoader(test_input, batch_size=params["test_batch_size"], shuffle=False)
+                    test_logits = torch.tensor([], device=device)
+                    for i, test_batch in enumerate(test_data_loader):
+                        pred = fmodel(test_batch.to(device=device)).detach()
+                        test_logits = torch.cat((test_logits, pred), 0)
+                    temp_test_loss = outer_criterion(test_logits, test_target.to(device=device))
+                    outer_loss += temp_test_loss
+            tepoch.set_postfix(loss=outer_loss / len(validation_loader))
+
+        if min_val_loss > outer_loss:  # save the train model
+            min_val_loss = outer_loss
+            checkpoint = {'Epoch': epoch,
+                          'state_dict': model.state_dict(),
+                          'optimizer': optimizer.state_dict()}
+            torch.save(checkpoint, params["checkpoint_path"] + model_params["name"] + "/"
+                       + params["dataset_name"] + "_" + str(epoch) + "_"
+                       + str(min_val_loss) + '.pth')
diff --git a/dataset/MetaPhysDataset.py b/dataset/MetaPhysDataset.py
@@ -36,23 +36,20 @@ class MetaPhysDataset(MetaDataset):
         A function/transform that takes a dataset (ie. a task), and returns a
         transformed version of it. E.g. `torchmeta.transforms.ClassSplitter()`.
     """
-    def __init__(self, num_shots_tr, num_shots_ts, person_data_path, state='train',transform=None,
-                 target_transform= None, random_seed=10, frame_depth=10, fs=30, unsupervised=0):
+
+    def __init__(self, num_shots_tr, num_shots_ts, person_data_path, option='train',
+                 fs=30, unsupervised=0,batch_size = 1,frame_depth=10,random_seed =10):
         super(MetaPhysDataset, self).__init__(meta_split='train', target_transform=ToTensor1D())
         self.transform = ToTensor1D()
         self.num_samples_per_task = num_shots_tr + num_shots_ts
         self.person_data_path = person_data_path
         self.frame_depth = frame_depth
         self.fs = fs
-        self.state = state
+        self.option = option
         self.num_shots_tr = num_shots_tr
         self.unsupervised = unsupervised
-
-        self.target_transform = target_transform
-        self.transform = transform
-
         np.random.seed(random_seed)
-        if self.state == 'train':
+        if self.option == 'train':
             self.dataset_transform = ClassSplitter(shuffle=False, num_train_per_class=num_shots_tr,
                                                    num_test_per_class=num_shots_ts)
 
@@ -61,15 +58,15 @@ def __len__(self):
 
 
     def __getitem__(self, index):
-        per_task_data = self.person_data_path[index][:-1]
+        per_task_data = self.person_data_path[index]
 
-        if self.state == 'test':
+        if self.option == 'test':
             self.num_shots_ts = len(per_task_data) - self.num_shots_tr
             self.dataset_transform = ClassSplitter(shuffle=False, num_train_per_class=self.num_shots_tr,
                                                    num_test_per_class=self.num_shots_ts)
             self.num_samples_per_task = self.num_shots_tr + self.num_shots_ts
 
-        if self.state == 'train':
+        if self.option == 'train':
             random.shuffle(per_task_data)
 
             self.num_shots_ts = len(per_task_data) - self.num_shots_tr
@@ -80,7 +77,7 @@ def __getitem__(self, index):
             self.num_samples_per_task = self.num_shots_tr + self.num_shots_ts
 
         task_path = per_task_data[:self.num_samples_per_task]
-        task = PersonTask(self.num_samples_per_task, task_path, self.num_shots_tr, frame_depth=self.frame_depth, fs=self.fs, state=self.state, unsupervised=self.unsupervised)
+        task = PersonTask(self.num_samples_per_task, task_path, self.num_shots_tr, frame_depth=self.frame_depth, fs=self.fs, option=self.option, unsupervised=self.unsupervised)
 
         if self.dataset_transform is not None:
             task = self.dataset_transform(task)
@@ -90,7 +87,7 @@ def __getitem__(self, index):
 
 class PersonTask(Task):
     def __init__(self, num_samples, task_data_path, num_shots_tr, frame_depth=10,
-                 fs=30, state='train', unsupervised=0):
+                 fs=30, option='train', unsupervised=0):
         super(PersonTask, self).__init__(None, None) # Regression task
         self.num_shots_tr = num_shots_tr
         self.num_samples = num_samples
@@ -99,7 +96,7 @@ def __init__(self, num_samples, task_data_path, num_shots_tr, frame_depth=10,
         self.task_data_path = task_data_path
         self.frame_depth = frame_depth
         self.fs = fs
-        self.state = state
+        self.option = option
         self.unsupervised = unsupervised
         self.len_data = 0
 

diff --git a/dataset/dataset_loader.py b/dataset/dataset_loader.py
@@ -16,7 +16,8 @@ def dataset_loader(save_root_path: str = "/media/hdd1/dy_dataset/",
                    num_shots: int = 6,
                    num_test_shots:int = 6,
                    fs: int = 30,
-                   unsupervised: int = 0):
+                   unsupervised: int = 0,
+                   batch_size = 1):
     '''
     :param save_root_path: save file destination path
     :param model_name : model_name
@@ -57,27 +58,27 @@ def dataset_loader(save_root_path: str = "/media/hdd1/dy_dataset/",
         test_path = []
 
         hpy_filelist = save_root_path + model_name + "/" + dataset_name+'/'
-        for i in sorted(os.listdir(hpy_filelist)[:20]):
+        for i in sorted(os.listdir(hpy_filelist)[:35]):
             path = []
             for j in sorted(os.listdir(hpy_filelist + i)):
                 path.append(hpy_filelist + i + '/' + j)
             train_path.append(path)
-        for i in sorted(os.listdir(hpy_filelist)[20:]):
+        for i in sorted(os.listdir(hpy_filelist)[35:]):
             path = []
             for j in sorted(os.listdir(hpy_filelist + i)):
                 path.append(hpy_filelist + i + '/' + j)
             test_path.append(path)
 
-        #print(train_path,test_path)
-
         dataset = MetaPhysDataset(num_shots,
                                   num_test_shots,
                                   train_path,
                                   option,
-                                  # transform=transform,
+                                  fs,
+                                  unsupervised,
+                                  batch_size,
+                                  frame_depth=10
+                                  #transform=transform,
                                   # target_transform=transform,
-                                  frame_depth=10,
-                                  fs=fs,
-                                  unsupervised=unsupervised)
+                                  )
 
     return dataset