fix: update TinyStories optimize to use `item_loader=TokensLoader()` #2148

bhimrazy · 2025-10-30T08:29:06Z

What does this pr do ?

This PR updates TinyStories optimize to use item_loader=TokensLoader() as per the rule from LitData, i.e.:

outputs = optimize(
    ...,
    # This is important to inform LitData that we are encoding a contiguous 1D array (tokens). 
    # LitData skips storing metadata for each sample, e.g., all the tokens are concatenated to form one large tensor.
    item_loader=TokensLoader(),
)

It was addressed in #2048 by @andyland , but the change was limited to the test and seems to be missed in the source.

Fixes #2144

Additional Info

Screenshots

Before: failing with error

After:

fix: update TinyStories data module to use TokensLoader for item loading

8f27aff

bhimrazy requested review from KaelanDt, andyland, k223kim, lantiga, lianakoleva and t-vi as code owners October 30, 2025 08:29

bhimrazy changed the title ~~fix: update TinyStories optimize to use item_loader=TokensLoader(),~~ fix: update TinyStories optimize to use item_loader=TokensLoader() Oct 30, 2025

bhimrazy added 2 commits November 4, 2025 15:44

Merge branch 'main' into fix/tinystories-optimize

0ddbe8d

re ttrigger

79e0b2a

lianakoleva approved these changes Nov 4, 2025

View reviewed changes

lianakoleva merged commit 062fff2 into Lightning-AI:main Nov 4, 2025
21 checks passed

bhimrazy deleted the fix/tinystories-optimize branch November 5, 2025 00:48

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

fix: update TinyStories optimize to use `item_loader=TokensLoader()` #2148

fix: update TinyStories optimize to use `item_loader=TokensLoader()` #2148

bhimrazy commented Oct 30, 2025 •

edited

Loading

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

fix: update TinyStories optimize to use item_loader=TokensLoader() #2148

fix: update TinyStories optimize to use item_loader=TokensLoader() #2148

Conversation

bhimrazy commented Oct 30, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

What does this pr do ?

Additional Info

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

fix: update TinyStories optimize to use `item_loader=TokensLoader()` #2148

fix: update TinyStories optimize to use `item_loader=TokensLoader()` #2148

bhimrazy commented Oct 30, 2025 •

edited

Loading