add bias in vllm moe (vllm-project#15)

Liangliang-Ma · web-flow · commit 22504460296b · 2025-11-10T16:21:01.000+08:00
Signed-off-by: Ma, Liangliang &lt;liangliang.ma@intel.com&gt;
diff --git a/vllm/model_executor/layers/fused_moe/layer.py b/vllm/model_executor/layers/fused_moe/layer.py
@@ -936,7 +936,9 @@ def forward_xpu(
         return xpu_fused_moe(
             hidden_states=x,
             w13=layer.w13_weight,
+            w13_bias=layer.w13_bias if self.moe.has_bias else None,
             w2=layer.w2_weight,
+            w2_bias=layer.w2_bias if self.moe.has_bias else None,
             topk_weights=routing_weights,
             topk_ids=selected_experts,
             n_experts_per_token=top_k,