[Frontend][OpenAI] Support for returning max_model_len on /v1/models response #4643

Avinash-Raj · 2024-05-07T03:11:42Z

This pull request introduces the max_model_len parameter to the response of the OpenAI server's /v1/models endpoint. This enhancement provides clients with information about the maximum number of tokens (prompt_tokens + output_tokens) that a model can support.

DarkLight1337 · 2024-05-31T15:58:35Z

LGTM, thanks for the contribution! @simon-mo can you manually trigger the remaining tests in the pipeline to be re-run?

…response (vllm-project#4643)

support for returning max_model_len on openai /v1/model response

a3a0cbf

DarkLight1337 approved these changes May 31, 2024

View reviewed changes

DarkLight1337 enabled auto-merge (squash) May 31, 2024 15:58

DarkLight1337 merged commit f790ad3 into vllm-project:main Jun 2, 2024
60 checks passed

blinkbear pushed a commit to blinkbear/vllm that referenced this pull request Jun 3, 2024

[Frontend][OpenAI] Support for returning max_model_len on /v1/models …

238e9b8

…response (vllm-project#4643)

robertgshaw2-neuralmagic pushed a commit to neuralmagic/nm-vllm that referenced this pull request Jun 11, 2024

[Frontend][OpenAI] Support for returning max_model_len on /v1/models …

dc64b07

…response (vllm-project#4643)

joerunde pushed a commit to joerunde/vllm that referenced this pull request Jun 17, 2024

[Frontend][OpenAI] Support for returning max_model_len on /v1/models …

0748547

…response (vllm-project#4643)

xjpang pushed a commit to xjpang/vllm that referenced this pull request Jun 27, 2024

[Frontend][OpenAI] Support for returning max_model_len on /v1/models …

3fed2f4

…response (vllm-project#4643)

This was referenced Jul 2, 2024

[Feature]: /info endpoint for OpenAI-compatible API Server #5959

Closed

Query vLLM OpenAI /models endpoint to get model name and context window continuedev/continue#1632

Merged

xjpang pushed a commit to xjpang/vllm that referenced this pull request Jul 8, 2024

[Frontend][OpenAI] Support for returning max_model_len on /v1/models …

9f4c321

…response (vllm-project#4643)

xjpang pushed a commit to xjpang/vllm that referenced this pull request Jul 24, 2024

[Frontend][OpenAI] Support for returning max_model_len on /v1/models …

a0e53c8

…response (vllm-project#4643)

Temirulan pushed a commit to Temirulan/vllm-whisper that referenced this pull request Sep 6, 2024

[Frontend][OpenAI] Support for returning max_model_len on /v1/models …

867e5a5

…response (vllm-project#4643)

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[Frontend][OpenAI] Support for returning max_model_len on /v1/models response #4643

[Frontend][OpenAI] Support for returning max_model_len on /v1/models response #4643

Avinash-Raj commented May 7, 2024

DarkLight1337 commented May 31, 2024

[Frontend][OpenAI] Support for returning max_model_len on /v1/models response #4643

[Frontend][OpenAI] Support for returning max_model_len on /v1/models response #4643

Conversation

Avinash-Raj commented May 7, 2024

DarkLight1337 commented May 31, 2024