default art to vllm default generation config, instead of model

Saumya Gandhi · Saumya Gandhi · commit c01b1339cf5f · 2025-05-23T11:51:50.000-07:00
diff --git a/src/art/dev/model.py b/src/art/dev/model.py
@@ -43,6 +43,7 @@ def get_model_config(
         # which is the fallback for devices with compute capability < 8.0
         num_scheduler_steps=16 if torch.cuda.get_device_capability()[0] >= 8 else 1,
         enable_sleep_mode=enable_sleep_mode,
+        generation_config="vllm",
     )
     engine_args.update(config.get("engine_args", {}))
     init_args.update(config.get("init_args", {}))
diff --git a/src/art/dev/openai_server.py b/src/art/dev/openai_server.py
@@ -27,6 +27,7 @@ def get_openai_server_config(
         num_scheduler_steps=16,
         served_model_name=base_model,
         disable_log_requests=True,
+        generation_config="vllm",
     )
     engine_args.update(config.get("engine_args", {}))
     return OpenAIServerConfig(

Original file line number	Diff line number	Diff line change
`@@ -43,6 +43,7 @@ def get_model_config(`
`43`	`43`	`# which is the fallback for devices with compute capability < 8.0`
`44`	`44`	`num_scheduler_steps=16 if torch.cuda.get_device_capability()[0] >= 8 else 1,`
`45`	`45`	`enable_sleep_mode=enable_sleep_mode,`
	`46`	`+ generation_config="vllm",`
`46`	`47`	`)`
`47`	`48`	`engine_args.update(config.get("engine_args", {}))`
`48`	`49`	`init_args.update(config.get("init_args", {}))`
Original file line number	Diff line number	Diff line change
`@@ -27,6 +27,7 @@ def get_openai_server_config(`
`27`	`27`	`num_scheduler_steps=16,`
`28`	`28`	`served_model_name=base_model,`
`29`	`29`	`disable_log_requests=True,`
	`30`	`+ generation_config="vllm",`
`30`	`31`	`)`
`31`	`32`	`engine_args.update(config.get("engine_args", {}))`
`32`	`33`	`return OpenAIServerConfig(`