selau642

selau642

Achievements

QuantizedAttention QuantizedAttention Public

GPU Triton Kernels written in Helion to speed up Attention inference, fine tuning and training speeds.

Python