sgl-project · YouNeedCryDear · Jul 13, 2025 · Jul 13, 2025 · Jul 14, 2025 · Jul 15, 2025
@@ -68,6 +68,7 @@ def override_quantization_method(self, *args, **kwargs):
 )
 from sglang.srt.layers.quantization.moe_wna16 import MoeWNA16Config
 from sglang.srt.layers.quantization.qoq import QoQConfig
+from sglang.srt.layers.quantization.rtn import RTNConfig
 from sglang.srt.layers.quantization.w4afp8 import W4AFp8Config
 from sglang.srt.layers.quantization.w8a8_fp8 import W8A8Fp8Config
 from sglang.srt.layers.quantization.w8a8_int8 import W8A8Int8Config
@@ -84,6 +85,7 @@ def override_quantization_method(self, *args, **kwargs):
     "compressed-tensors": CompressedTensorsConfig,
     "qoq": QoQConfig,
     "w4afp8": W4AFp8Config,
+    "rtn": RTNConfig,
 }
 
 # VLLM-dependent quantization methods