Releases · ggerganov/llama.cpp

19 Mar 10:09

b80cf3b

b2463

common : disable repeat penalties by default (#6127)

Assets 15

19 Mar 09:29

github-actions

b2462

970a480

b2462

ci : exempt some labels from being tagged as stale (#6140)

Assets 15

19 Mar 07:02

github-actions

b2461

4c28b82

b2461

common : print usage on '-h' and '--help' (#6145)

Assets 15

18 Mar 20:30

github-actions

b2459

d199ca7

b2459

mpt : implement backwards compatiblity with duped output tensor (#6139)

Assets 15

18 Mar 19:37

github-actions

b2458

104f5e0

b2458

clip : fix memory leak (#6138)

Assets 15

18 Mar 17:05

github-actions

b2457

5e1b7f9

b2457

backend : set max split inputs to GGML_MAX_SRC (#6137)

Assets 15

18 Mar 12:56

github-actions

b2456

ac9ee6a

b2456

ci : disable stale issue messages (#6126)

Assets 15

18 Mar 12:44

github-actions

b2455

4f6d133

b2455

ci : temporary disable sanitizer builds (#6128)

Assets 15

18 Mar 10:55

github-actions

b2454

2bf8d0f

b2454

backend : offload large batches to GPU (#6083)

* backend : offload large batches to GPU

* fix hip

* code cleanup

* fix CUDA split buffers

* Update ggml-backend-impl.h

Co-authored-by: Johannes Gäßler <johannesg@5d6.de>

* cuda : fix memset without set_device

* imatrix : remove sched affix from weight names

* sched : add a new split if the current one has too many inputs
reduce max inputs per split
more cleanup

* update backends

ggml-ci

---------

Co-authored-by: Johannes Gäßler <johannesg@5d6.de>

Assets 15

18 Mar 10:10

github-actions

b2453

496bc79

b2453

common : tidy-up argument parsing (#6105)

* Tidy-up argument parsing.

* Missing ref.

* common : minor

* common : add static classifier

---------

Co-authored-by: Georgi Gerganov <ggerganov@gmail.com>

Assets 15

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Releases: ggerganov/llama.cpp

b2463

b2462

b2461

b2459

b2458

b2457

b2456

b2455

b2454

b2453