Tags · hongxiayang/vllm

v0.8.3

Revert "[V1] DP scale-out (1/N): Use zmq ROUTER/DEALER sockets for in…

…put queue (vllm-project#15906)"

This reverts commit 651cf0f.

Apr 6, 2025
296c657
zip
tar.gz

v0.8.3rc1

[V1][Spec Decode] Update N-gram Proposer Interface (vllm-project#15750)

Signed-off-by: Woosuk Kwon <woosuk.kwon@berkeley.edu>

Apr 4, 2025
63375f0
zip
tar.gz

v0.8.2

[V1][Spec Decode] Update target_logits in place for rejection sampling (

vllm-project#15427)

Signed-off-by: Woosuk Kwon <woosuk.kwon@berkeley.edu>

Mar 25, 2025
25f560a
zip
tar.gz

v0.8.1

[V1] Minor V1 async engine test refactor (vllm-project#15075)

Signed-off-by: andoorve <murali.andoorveedu@mail.utoronto.ca>
Co-authored-by: andoorve <murali.andoorveedu@mail.utoronto.ca>

Mar 19, 2025
61c7a1b
zip
tar.gz

v0.8.0

[Bugfix] Fix LoRA extra vocab size (vllm-project#15047)

Signed-off-by: Jee Jee Li <pandaleefree@gmail.com>

Mar 18, 2025
966f933
zip
tar.gz

v0.8.0rc2

[Bugfix] Make Gemma3 MM V0 only for now (vllm-project#14971)

Signed-off-by: Roger Wang <ywang@roblox.com>

Mar 17, 2025
37e3806
zip
tar.gz

v0.8.0rc1

[V1] [Spec Decode] Support random sampling for spec decode (vllm-proj…

…ect#13933)

Co-authored-by: Woosuk Kwon <woosuk.kwon@berkeley.edu>

Mar 17, 2025
8d6cf89
zip
tar.gz

v0.7.3

[Bugfix] Fix deepseekv3 grouped topk error (vllm-project#13474)

Signed-off-by: Chen-XiaoBing <chenxb002@whu.edu.cn>

Feb 20, 2025
ed6e907
zip
tar.gz

v0.7.2

[Misc] Improve error message for incorrect pynvml (vllm-project#12809)

Signed-off-by: youkaichao <youkaichao@gmail.com>

Feb 6, 2025
0408efc
zip
tar.gz

v0.7.1

Disable chunked prefill and/or prefix caching when MLA is enabled (vl…

…lm-project#12642)

From @mgoin in vllm-project#12638

I cannot push to that branch, therefore a new PR to unblock release.

---------

Signed-off-by: mgoin <michael@neuralmagic.com>
Signed-off-by: simon-mo <simon.mo@hey.com>
Co-authored-by: mgoin <michael@neuralmagic.com>

Feb 1, 2025
4f4d427
zip
tar.gz

PreviousNext

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

v0.8.3

v0.8.3rc1

v0.8.2

v0.8.1

v0.8.0

v0.8.0rc2

v0.8.0rc1

v0.7.3

v0.7.2

v0.7.1

Tags: hongxiayang/vllm