fix spurious

vllm-project · robertgshaw2-redhat · Jan 8, 2025 · Oct 11, 2024 · Oct 11, 2024 · Oct 11, 2024
commit 14ccb90bdefaeb555a549e26b50d9ccdca5d4287
diff --git a/vllm/model_executor/model_loader/loader.py b/vllm/model_executor/model_loader/loader.py
@@ -411,7 +411,6 @@ def load_model(self, *, model_config: ModelConfig,
                     # parameters onto device for processing and back off after.
                     with device_loading_context(module, target_device):
                         quant_method.process_weights_after_loading(module)
-
         return model.eval()
 
 
@@ -1147,6 +1146,7 @@ def load_model(self, *, model_config: ModelConfig,
                                           lora_config, cache_config)
 
                 self._load_weights(model_config, model)
+
         return model.eval()