Fix: Falcon tie_word_embeddings in GGUF (#35715)

MekkCyber · web-flow · commit fd4f14c968cf · 2025-01-16T13:18:22.000+01:00
* fix falcon tie_word_embeddings

* fix style
diff --git a/src/transformers/modeling_gguf_pytorch_utils.py b/src/transformers/modeling_gguf_pytorch_utils.py
@@ -400,8 +400,9 @@ def load_gguf_checkpoint(gguf_checkpoint_path, return_tensors=False, model_to_lo
 
     # Handle tie_word_embeddings, if lm_head.weight is not present in tensors,
     # tie_word_embeddings is true otherwise false
-    parsed_parameters["config"]["tie_word_embeddings"] = all(
-        "output.weight" != tensor.name for tensor in reader.tensors
+    exceptions = ["falcon"]
+    parsed_parameters["config"]["tie_word_embeddings"] = (
+        all("output.weight" != tensor.name for tensor in reader.tensors) or architecture in exceptions
     )
 
     # List all key-value pairs in a columnized format