Add arg to LLM

vllm-project · simon-mo · Oct 18, 2024 · Oct 16, 2024 · Oct 16, 2024 · Oct 16, 2024
commit 67c840a53f56a3a248e6d2f7085e709bc538c3d2
diff --git a/vllm/entrypoints/llm.py b/vllm/entrypoints/llm.py
@@ -8,7 +8,7 @@
 
 from vllm.beam_search import (BeamSearchInstance, BeamSearchOutput,
                               BeamSearchSequence, get_beam_search_score)
-from vllm.engine.arg_utils import EngineArgs
+from vllm.engine.arg_utils import EngineArgs, TaskOption
 from vllm.engine.llm_engine import LLMEngine
 from vllm.entrypoints.chat_utils import (ChatCompletionMessageParam,
                                          apply_hf_chat_template,
@@ -120,6 +120,7 @@ def deprecate_legacy_api(cls):
     def __init__(
         self,
         model: str,
+        task: TaskOption = "auto",
         tokenizer: Optional[str] = None,
         tokenizer_mode: str = "auto",
         skip_tokenizer_init: bool = False,
@@ -153,6 +154,7 @@ def __init__(
 
         engine_args = EngineArgs(
             model=model,
+            task=task,
             tokenizer=tokenizer,
             tokenizer_mode=tokenizer_mode,
             skip_tokenizer_init=skip_tokenizer_init,