v0.3.3 vllm.entrypoints.openai.api_server  error

1. GPU：4090 * 4
2. `pip install vllm==0.3.3`
3. `python3 -m vllm.entrypoints.openai.api_server   --model /Llama-2-7B-Chat-hf/   --engine-use-ray   --host 0.0.0.0   --port 8080   --worker-use-ray   --max-num-seqs 64   --tensor-parallel-size 4`
4. When I send a request：![image](https://github.com/vllm-project/vllm/assets/42427430/92e6ca0f-8f49-4800-b8d7-fc4981c57323)
5. The following error occurs![image](https://github.com/vllm-project/vllm/assets/42427430/4354f758-e1ce-4345-a3a0-4ea1b29c5108)





Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Uh oh!

v0.3.3 vllm.entrypoints.openai.api_server error #3296

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Uh oh!

v0.3.3 vllm.entrypoints.openai.api_server error #3296

Description

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions