HellaSwag: speed up by parallelizing log-prob evaluation #5020

ikawrakow · 2024-01-18T16:37:11Z

After PR #5017 that has significantly improved the performance of HellaSwag evaluation via batching, the fraction of time spent in evaluating token log-probabilities in single threaded mode has become significant.

With this PR, this part of the calculation is parallelized.

For Mistral-7B and fp16, time on my system (32-core Ryze-5975WX + RTX-4080) goes down from 536 seconds after PR #5017 to 423 seconds for the full evaluation dataset (10042 tasks).

For reference, evaluation time before #5017 was 1285 seconds.

For Mistral-7B and fp16, time on my system goes down from 536 seconds to 423 seconds for the full evaluation dataset (10042 tasks).

* perplexity : fix MSVC build after #5020 * try a differerent fix

) For Mistral-7B and fp16, time on my system goes down from 536 seconds to 423 seconds for the full evaluation dataset (10042 tasks). Co-authored-by: Iwan Kawrakow <iwan.kawrakow@gmail.com>

* perplexity : fix MSVC build after ggerganov#5020 * try a differerent fix

) For Mistral-7B and fp16, time on my system goes down from 536 seconds to 423 seconds for the full evaluation dataset (10042 tasks). Co-authored-by: Iwan Kawrakow <iwan.kawrakow@gmail.com>

* perplexity : fix MSVC build after ggerganov#5020 * try a differerent fix

hellaswag: speed up even more by parallelizing log-prob evaluation

ccc78a2

For Mistral-7B and fp16, time on my system goes down from 536 seconds to 423 seconds for the full evaluation dataset (10042 tasks).

ggerganov approved these changes Jan 18, 2024

View reviewed changes

ggerganov merged commit 3e945cc into master Jan 18, 2024
39 of 47 checks passed

cebtenzzre added a commit that referenced this pull request Jan 19, 2024

fix MSVC build after #5020

639bd9c

cebtenzzre added a commit that referenced this pull request Jan 19, 2024

perplexity : fix MSVC build after #5020

e15c616

ggerganov pushed a commit that referenced this pull request Jan 20, 2024

perplexity : fix MSVC build after #5020 (#5043)

97c1549

* perplexity : fix MSVC build after #5020 * try a differerent fix

crasm pushed a commit that referenced this pull request Jan 23, 2024

perplexity : fix MSVC build after #5020 (#5043)

b6afda6

* perplexity : fix MSVC build after #5020 * try a differerent fix

jordankanter pushed a commit to jordankanter/llama.cpp that referenced this pull request Feb 3, 2024

perplexity : fix MSVC build after ggerganov#5020 (ggerganov#5043)

e9a3308

* perplexity : fix MSVC build after ggerganov#5020 * try a differerent fix

hodlen pushed a commit to hodlen/llama.cpp that referenced this pull request Apr 1, 2024

perplexity : fix MSVC build after ggerganov#5020 (ggerganov#5043)

093d068

* perplexity : fix MSVC build after ggerganov#5020 * try a differerent fix

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

HellaSwag: speed up by parallelizing log-prob evaluation #5020

HellaSwag: speed up by parallelizing log-prob evaluation #5020

ikawrakow commented Jan 18, 2024

HellaSwag: speed up by parallelizing log-prob evaluation #5020

HellaSwag: speed up by parallelizing log-prob evaluation #5020

Conversation

ikawrakow commented Jan 18, 2024