update in place add only for inference

HabanaAI · Feb 29, 2024 · Feb 23, 2024 · Feb 26, 2024 · Feb 27, 2024 · Feb 28, 2024
commit 8eab266b339b013aea80750b5436896952606894
@@ -551,8 +551,12 @@ def pre_attn(
     def post_attn_pre_mlp(self, hidden_states, residual):
         hidden_states = self.self_attn.post_attn_forward(hidden_states)
 
-        residual.add_(hidden_states)
-        hidden_states = residual
+        if self.training:
+            hidden_states = hidden_states + residual
+            residual = hidden_states
+        else:
+            residual.add_(hidden_states)
+            hidden_states = residual
 
         hidden_states = self.post_attention_layernorm(hidden_states)
 
@@ -562,8 +566,11 @@ def post_attn_pre_mlp(self, hidden_states, residual):
     def post_mlp(self, hidden_states, residual):
         hidden_states = self.mlp.post_mlp_forward(hidden_states)
 
-        residual.add_(hidden_states)
-        hidden_states = residual
+        if self.training:
+            hidden_states = hidden_states + residual
+        else:
+            residual.add_(hidden_states)
+            hidden_states = residual
 
         return hidden_states