fix e2m3/e3m2 bug

fxmarty-amd · fxmarty-amd · commit c537c761070f · 2025-07-18T10:57:23.000+02:00
Signed-off-by: Felix Marty &lt;Felix.Marty@amd.com&gt;
diff --git a/vllm/model_executor/layers/fused_moe/config.py b/vllm/model_executor/layers/fused_moe/config.py
@@ -60,9 +60,9 @@ def get_config_quant_dtype(
         return torch.int8
     elif ocp_mx_scheme == "w_fp4_a_fp4":
         return "fp4"
-    elif ocp_mx_scheme in ["w_fp4_a_fp6_e3m2", "w_fp4_a_fp6_e2m3", "w_fp6_e3m2_a_fp6_e3m2"]:
+    elif ocp_mx_scheme in {"w_fp4_a_fp6_e3m2", "w_fp6_e3m2_a_fp6_e3m2"}:
         return "fp6_e3m2"
-    elif ocp_mx_scheme == "w_fp6_e2m3_a_fp6_e2m3":
+    elif ocp_mx_scheme in {"w_fp4_a_fp6_e2m3", "w_fp6_e2m3_a_fp6_e2m3"}:
         return "fp6_e2m3"
     return None