update for CB #714

ArthurZucker · 2025-05-09T11:16:41Z

Add necessary changes to call generate with CB
Linked PR: huggingface/transformers#38085
This works:

from lighteval.logging.evaluation_tracker import EvaluationTracker
from lighteval.pipeline import Pipeline, PipelineParameters, ParallelismManager
from lighteval.models.endpoints.inference_providers_model import (
    InferenceProvidersModelConfig,
)
from lighteval.models.transformers.transformers_model import TransformersModel
import torch
from transformers import AutoModelForCausalLM, GenerationConfig

MODEL_NAME = "meta-llama/Meta-Llama-3-8B-Instruct"
PROVIDER = "hf-inference"
BENCHMARKS = "lighteval|gsm8k|0|0"

evaluation_tracker = EvaluationTracker(output_dir="./results")
pipeline_params = PipelineParameters(
    use_chat_template=True, launcher_type=ParallelismManager.NONE, max_samples=None
)

model = AutoModelForCausalLM.from_pretrained(
    "meta-llama/Llama-3.2-3b-Instruct", attn_implementation="sdpa_paged", torch_dtype=torch.bfloat16, device_map="auto"
)

# Configure generation parameters
generation_config = GenerationConfig(
    max_new_tokens=10,
    eos_token_id=model.config.eos_token_id,
    pad_token_id=model.config.pad_token_id,
    num_blocks=2048,
    block_size=256,
)
model.generation_config = generation_config
model = TransformersModel.from_model(model)
pipeline = Pipeline(
    model=model,
    pipeline_parameters=pipeline_params,
    evaluation_tracker=evaluation_tracker,
    tasks=BENCHMARKS,
)

pipeline.evaluate()
results = pipeline.get_results()["results"]
print(results)

HuggingFaceDocBuilderDev · 2025-05-09T11:18:46Z

The docs for this PR live here. All of your documentation changes will be reflected on that endpoint. The docs are available until 30 days after the last update.

ArthurZucker · 2025-05-09T13:57:27Z

{'lighteval:gsm8k:0': defaultdict(<class 'float'>, {'extractive_match': 0.00530705079605762, 'extractive_match_stderr': 0.0020013057209480414}), 'all': {'extractive_match': 0.00530705079605762, 'extractive_match_stderr': 0.0020013057209480414}}

ArthurZucker · 2025-05-09T13:58:13Z

I only generated 10 tokens that explains why

src/lighteval/models/transformers/transformers_model.py

… into add-fast-generate

update for CB

41838c0

update

f7a3c2f

clefourrier reviewed May 13, 2025

View reviewed changes

src/lighteval/models/transformers/transformers_model.py Outdated Show resolved Hide resolved

push

c9b3467

NathanHB linked an issue May 15, 2025 that may be closed by this pull request

[FT] Continuous batching for transformers #723

Open

This was referenced May 15, 2025

[FT] Faster generation with TransformersModel by using less padding #531

Closed

[FT] Custom model to TransformersModel #489

Open

clefourrier and others added 3 commits May 19, 2025 14:54

Merge branch 'main' into add-fast-generate

796ef5a

c'est une honte, 0.2.... ruff....

a7e2751

Merge branch 'add-fast-generate' of github.com:ArthurZucker/lighteval…

a1c4c00

… into add-fast-generate

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

update for CB #714

update for CB #714

ArthurZucker commented May 9, 2025 •

edited

Loading

Uh oh!

HuggingFaceDocBuilderDev commented May 9, 2025

Uh oh!

ArthurZucker commented May 9, 2025 •

edited

Loading

Uh oh!

ArthurZucker commented May 9, 2025

Uh oh!

Uh oh!

Uh oh!

update for CB #714

Are you sure you want to change the base?

update for CB #714

Conversation

ArthurZucker commented May 9, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

HuggingFaceDocBuilderDev commented May 9, 2025

Uh oh!

ArthurZucker commented May 9, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

ArthurZucker commented May 9, 2025

Uh oh!

Uh oh!

Uh oh!

ArthurZucker commented May 9, 2025 •

edited

Loading

ArthurZucker commented May 9, 2025 •

edited

Loading