[Quantization] Allow loading of transform configs #40673

kylesayrs · 2025-09-03T23:28:31Z

Purpose

Support loading models with online transforms applied via Compressed Tensors (LLM Compressor)

Prerequisites

[Transform] Support loading random hadamards on meta device vllm-project/compressed-tensors#445

Changes

Require a minimum compressed tensors version of 0.11.0 (to support transform features)
Load transform configs (if available), and apply them to the model before weight loading
(misc) Refactor compressed tensors tests to check for perplexity, rather than exact output matches
(misc) Remove update_dtype in order to reduce complexity and give users more control/predictability of model data types

Testing

Regression tested using CompressedTensorsTest, added an online quip-style transformed model for testing
- Perplexity results match expectations

Signed-off-by: Kyle Sayers <kylesayrs@gmail.com>

Rocketknight1 · 2025-09-04T12:12:47Z

cc @MekkCyber

kylesayrs · 2025-09-04T16:07:06Z

Putting in draft for now, need to do some more testing

Signed-off-by: Kyle Sayers <kylesayrs@gmail.com>

src/transformers/quantizers/quantizer_compressed_tensors.py

Signed-off-by: Kyle Sayers <kylesayrs@gmail.com>

github-actions · 2025-10-01T17:16:48Z

[For maintainers] Suggested jobs to run (before merge)

run-slow: compressed_tensors_integration

kylesayrs · 2025-12-15T23:47:27Z

#42887

kylesayrs added 4 commits September 3, 2025 19:23

apply transform config

8fd2c05

Signed-off-by: Kyle Sayers <kylesayrs@gmail.com>

remove unused code

da8a76a

Signed-off-by: Kyle Sayers <kylesayrs@gmail.com>

reorder application

49b14f0

Signed-off-by: Kyle Sayers <kylesayrs@gmail.com>

fix style

655149a

Signed-off-by: Kyle Sayers <kylesayrs@gmail.com>

kylesayrs mentioned this pull request Sep 4, 2025

[Transform] Support loading random hadamards on meta device vllm-project/compressed-tensors#445

Merged

Merge branch 'main' into kylesayrs/ct-apply-transform

a943f42

kylesayrs marked this pull request as draft September 4, 2025 16:06

patch_tie_weights_fn

ac720f4

Signed-off-by: Kyle Sayers <kylesayrs@gmail.com>

brian-dellabetta reviewed Sep 9, 2025

View reviewed changes

src/transformers/quantizers/quantizer_compressed_tensors.py Show resolved Hide resolved

minor updates

02d5f25

Signed-off-by: Kyle Sayers <kylesayrs@gmail.com>

kylesayrs closed this Dec 15, 2025

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

[Quantization] Allow loading of transform configs #40673

[Quantization] Allow loading of transform configs #40673

kylesayrs commented Sep 3, 2025 •

edited

Loading

Uh oh!

Rocketknight1 commented Sep 4, 2025

Uh oh!

kylesayrs commented Sep 4, 2025

Uh oh!

Uh oh!

github-actions bot commented Oct 1, 2025

Uh oh!

kylesayrs commented Dec 15, 2025

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

[Quantization] Allow loading of transform configs #40673

[Quantization] Allow loading of transform configs #40673

Conversation

kylesayrs commented Sep 3, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Purpose

Prerequisites

Changes

Testing

Uh oh!

Rocketknight1 commented Sep 4, 2025

Uh oh!

kylesayrs commented Sep 4, 2025

Uh oh!

Uh oh!

github-actions bot commented Oct 1, 2025

Uh oh!

kylesayrs commented Dec 15, 2025

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

kylesayrs commented Sep 3, 2025 •

edited

Loading