fix backward error in DDP when running reward model finetune in RLHF

Signed-off-by: Wang, Yi A <yi.a.wang@intel.com>
huggingface · regisss · Jan 8, 2024 · Nov 3, 2023 · Jan 8, 2024 · 361b25272de9667649ed717b2ddda03d863122bc
commit 361b25272de9667649ed717b2ddda03d863122bc
@@ -599,6 +599,9 @@ def prepare_inputs_for_generation(
 
 def apply_customized_rope(q, k, cos, sin, position_ids):
     if q.device.type == "hpu" and FusedRoPE:
-        return FusedRoPE.apply(q, cos, sin, position_ids), FusedRoPE.apply(k, cos, sin, position_ids)
+        # TODO: remove `.clone()` when SynapseAI v1.15 is released
+        return FusedRoPE.apply(q, cos.clone(), sin.clone(), position_ids), FusedRoPE.apply(
+            k, cos.clone(), sin.clone(), position_ids
+        )
     else:
         return apply_rotary_pos_emb(q, k, cos, sin, position_ids)