fix format error

Signed-off-by: Jinzhen Lin <linjinzhen@hotmail.com>
vllm-project · mgoin · Jan 29, 2025 · Jan 18, 2025 · Jan 18, 2025 · Jan 18, 2025
commit 29df4d082d0a66a5dbc02b016de38b70a8c13fb3
@@ -56,10 +56,10 @@ def get_quantization_config(quantization: str) -> Type[QuantizationConfig]:
     from .ipex_quant import IPEXConfig
     from .marlin import MarlinConfig
     from .modelopt import ModelOptFp8Config
+    from .moe_quant_int import MoeQuantIntConfig
     from .neuron_quant import NeuronQuantConfig
     from .qqq import QQQConfig
     from .tpu_int8 import Int8TpuConfig
-    from .moe_quant_int import MoeQuantIntConfig
 
     method_to_config: Dict[str, Type[QuantizationConfig]] = {
         "aqlm": AQLMConfig,

diff --git a/vllm/model_executor/layers/quantization/moe_quant_int.py b/vllm/model_executor/layers/quantization/moe_quant_int.py
@@ -7,12 +7,12 @@
     FusedMoE, FusedMoEMethodBase, FusedMoeWeightScaleSupported)
 from vllm.model_executor.layers.linear import (
     LinearBase, UnquantizedLinearMethod)
+from vllm.model_executor.layers.quantization.awq_marlin import (
+    AWQMarlinConfig, AWQMarlinLinearMethod)
 from vllm.model_executor.layers.quantization.base_config import (
     QuantizationConfig, QuantizeMethodBase)
 from vllm.model_executor.layers.quantization.gptq_marlin import (
     GPTQMarlinConfig, GPTQMarlinLinearMethod)
-from vllm.model_executor.layers.quantization.awq_marlin import (
-    AWQMarlinConfig, AWQMarlinLinearMethod)
 from vllm.model_executor.utils import set_weight_attrs