microsoft · raviskolli · Apr 7, 2021 · Apr 21, 2021 · Apr 21, 2021 · ashbhandare
diff --git a/src/transformers/trainer.py b/src/transformers/trainer.py
@@ -1179,6 +1179,10 @@ def train(
             self.control = self.callback_handler.on_epoch_begin(self.args, self.state, self.control)
 
             for step, inputs in enumerate(epoch_iterator):
+
+                start_train_step_time = time.time()
+                if (self.state.global_step == 1):
+                    start_train_stable_time = time.time()
 
                 # Skip past any already trained steps if resuming training
                 if steps_trained_in_current_epoch > 0:
@@ -1255,6 +1259,10 @@ def train(
 
                     self._maybe_log_save_evaluate(tr_loss, model, trial, epoch)
 
+                ort_step_metrics = speed_metrics("train_step", 
+                    start_train_step_time, self.args.per_device_train_batch_size)
+                self.log(ort_step_metrics)
+
                 if self.control.should_epoch_stop or self.control.should_training_stop:
                     break
 
@@ -1302,10 +1310,14 @@ def train(
                 )
 
         metrics = speed_metrics("train", start_time, self.state.max_steps)
+        ort_end_train_metrics = speed_metrics("train",
+            start_train_stable_time, (num_examples*num_train_epochs - total_train_batch_size))
+
         if self._total_flos is not None:
             self.store_flos()
             metrics["total_flos"] = self.state.total_flos
         self.log(metrics)
+        self.log(ort_end_train_metrics)
 
         self.control = self.callback_handler.on_train_end(self.args, self.state, self.control)
         # add remaining tr_loss