Opt #40

kaselby · 2025-06-24T15:57:01Z

Description

Adds support for OPT. As this model is significantly different than the others, this requires a new cpp kernel and weight cache. I'd appreciate if this could be looked over by someone with more experience in this area than me, as I am not sure I implemented this in the most elegant way possible.

vkkhare · 2025-06-28T09:50:41Z

Why do we need different kernels here? Is it because we want relu activation instead of Silu?

vkkhare · 2025-07-01T12:41:28Z

Shall we go ahead for merging this PR?

kaselby · 2025-07-01T12:42:53Z

Did you want me to try to refactor the cpp code first? I know you mentioned it might be better to keep it all in one file/function with flags to distinguish them

vkkhare · 2025-07-01T12:43:53Z

Sure lets do that and merge there after

Signed-off-by: Kira Selby <kaselby@uwaterloo.ca>

…rsity thresholds Signed-off-by: Kira Selby <kaselby@uwaterloo.ca>

Signed-off-by: Kira Selby <kaselby@uwaterloo.ca>

…emove predictor loss and type hints). Signed-off-by: Kira Selby <kaselby@uwaterloo.ca>

Signed-off-by: Kira Selby <kaselby@uwaterloo.ca>

…el with sparse predictors disabled in order for activation capture to work properly. Signed-off-by: Kira Selby <kaselby@uwaterloo.ca>

* Add KV cache to benchmark.py Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Add KV cache to benchmark.py Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Fixes Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Add topk and statistical topk sparsity methods as well as initial sparsity thresholds Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Fix activation capture for generate dataset Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Fix activation capture for generate dataset Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Fix config sparsities Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Fix config Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Initial commit for opt. Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Initial commit for opt. Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Fixing bugs Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Working version of OPT code. Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Fix small syntax error and update OPT code to match new formatting (remove predictor loss and type hints). Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Replace separate OPT kernels with flags for base sparse kernels. Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Replace separate OPT kernels with flags for base sparse kernels. Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Fixes Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Updating opt code to work with current codebase Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Small fixes and rework to generate_dataset to use the sparse base model with sparse predictors disabled in order for activation capture to work properly. Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> --------- Signed-off-by: Kira Selby <kaselby@uwaterloo.ca>

* Opt (#40) * Add KV cache to benchmark.py Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Add KV cache to benchmark.py Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Fixes Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Add topk and statistical topk sparsity methods as well as initial sparsity thresholds Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Fix activation capture for generate dataset Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Fix activation capture for generate dataset Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Fix config sparsities Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Fix config Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Initial commit for opt. Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Initial commit for opt. Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Fixing bugs Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Working version of OPT code. Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Fix small syntax error and update OPT code to match new formatting (remove predictor loss and type hints). Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Replace separate OPT kernels with flags for base sparse kernels. Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Replace separate OPT kernels with flags for base sparse kernels. Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Fixes Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Updating opt code to work with current codebase Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Small fixes and rework to generate_dataset to use the sparse base model with sparse predictors disabled in order for activation capture to work properly. Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> --------- Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * KV Cache and Topk sparsity (#61) * Add KV cache to benchmark.py Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Add KV cache to benchmark.py Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Fixes Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Add topk and statistical topk sparsity methods as well as initial sparsity thresholds Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Fix activation capture for generate dataset Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Fix activation capture for generate dataset Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Fix config sparsities Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Fix config Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Fix activation capture to be capturing hidden states at the start of layer instead of start of MLP block Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Added documentation to measure_gt_sparsity to indicate how it can be used to calculate sparsity thresholds for topk Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * add sparsity method parameter to downstream eval Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> --------- Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> Signed-off-by: Kira Selby <30674826+kaselby@users.noreply.github.com> Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * updated forward pass Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Add flag to disable weight cache and compute sparsity without union over batch dimension Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Set default value of use_weight_cache to true if not found in config Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * removing unnecessary cpp kernels Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * remove references to sparse_mlp_forward and fix opt skip mlp Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Fix Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Fixes Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Attempt to fix whatever happened with the previous unsigned commit Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Fixes Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Fixes Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * remove break after eos token in benchmark to ensure consistent benchmarking Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Minor fixes to configs and modelling_opt, as well as fixes t ensure cuda is properly being utilized Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Fix minor issues with evaluation script arguments Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Fix minor issues with evaluation script arguments Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> * Merge updates to activation capture Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> --------- Signed-off-by: Kira Selby <kaselby@uwaterloo.ca> Signed-off-by: Kira Selby <30674826+kaselby@users.noreply.github.com>

kaselby force-pushed the opt branch from 6f9e3e8 to 469eca7 Compare July 28, 2025 15:30

kaselby added 18 commits July 30, 2025 13:23

Add KV cache to benchmark.py

581ef01

Signed-off-by: Kira Selby <kaselby@uwaterloo.ca>

Add KV cache to benchmark.py

bfcc122

Signed-off-by: Kira Selby <kaselby@uwaterloo.ca>

Fixes

b85f26c

Signed-off-by: Kira Selby <kaselby@uwaterloo.ca>

Add topk and statistical topk sparsity methods as well as initial spa…

70e9c65

…rsity thresholds Signed-off-by: Kira Selby <kaselby@uwaterloo.ca>

Fix activation capture for generate dataset

091716a

Signed-off-by: Kira Selby <kaselby@uwaterloo.ca>

Fix activation capture for generate dataset

74b435e

Signed-off-by: Kira Selby <kaselby@uwaterloo.ca>

Fix config sparsities

ba4e8ad

Signed-off-by: Kira Selby <kaselby@uwaterloo.ca>

Fix config

d561d44

Signed-off-by: Kira Selby <kaselby@uwaterloo.ca>

Initial commit for opt.

783524c

Signed-off-by: Kira Selby <kaselby@uwaterloo.ca>

Initial commit for opt.

cbf5b95

Signed-off-by: Kira Selby <kaselby@uwaterloo.ca>

Fixing bugs

437664f

Signed-off-by: Kira Selby <kaselby@uwaterloo.ca>

Working version of OPT code.

0056cbd

Signed-off-by: Kira Selby <kaselby@uwaterloo.ca>

Fix small syntax error and update OPT code to match new formatting (r…

83fe5b7

…emove predictor loss and type hints). Signed-off-by: Kira Selby <kaselby@uwaterloo.ca>

Replace separate OPT kernels with flags for base sparse kernels.

2eac59b

Signed-off-by: Kira Selby <kaselby@uwaterloo.ca>

Replace separate OPT kernels with flags for base sparse kernels.

08f6a5a

Signed-off-by: Kira Selby <kaselby@uwaterloo.ca>

Fixes

d9a8753

Signed-off-by: Kira Selby <kaselby@uwaterloo.ca>

Updating opt code to work with current codebase

103443e

Signed-off-by: Kira Selby <kaselby@uwaterloo.ca>

Small fixes and rework to generate_dataset to use the sparse base mod…

b545b30

…el with sparse predictors disabled in order for activation capture to work properly. Signed-off-by: Kira Selby <kaselby@uwaterloo.ca>

kaselby force-pushed the opt branch from 68e27aa to b545b30 Compare July 30, 2025 22:03

vkkhare approved these changes Aug 1, 2025

View reviewed changes

vkkhare merged commit fb12264 into NimbleEdge:main Aug 1, 2025
1 check passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Opt #40

Opt #40

Uh oh!

kaselby commented Jun 24, 2025

Uh oh!

vkkhare commented Jun 28, 2025

Uh oh!

vkkhare commented Jul 1, 2025

Uh oh!

kaselby commented Jul 1, 2025

Uh oh!

vkkhare commented Jul 1, 2025

Uh oh!

Uh oh!

Uh oh!

Opt #40

Opt #40

Uh oh!

Conversation

kaselby commented Jun 24, 2025

Description

Uh oh!

vkkhare commented Jun 28, 2025

Uh oh!

vkkhare commented Jul 1, 2025

Uh oh!

kaselby commented Jul 1, 2025

Uh oh!

vkkhare commented Jul 1, 2025

Uh oh!

Uh oh!

Uh oh!