vgoklani

Vishal Goklani vgoklani

Interested in Deep Learning (self-supervised learning & LLMs), Astrophysics (exoplanets), and Cosmology (CMB).... I like to build things

Pinned Loading

pytorch/pytorch pytorch/pytorch Public

Tensors and Dynamic neural networks in Python with strong GPU acceleration

Python 97.9k 27k
NVIDIA/TransformerEngine NVIDIA/TransformerEngine Public

A library for accelerating Transformer models on NVIDIA GPUs, including using 8-bit and 4-bit floating point (FP8 and FP4) precision on Hopper, Ada and Blackwell GPUs, to provide better performance…

Python 3.2k 650
RedisTimeSeries/RedisTimeSeries RedisTimeSeries/RedisTimeSeries Public

Time Series data structure for Redis

C 1.1k 144
IST-DASLab/gptq IST-DASLab/gptq Public

Code for the ICLR 2023 paper "GPTQ: Accurate Post-training Quantization of Generative Pretrained Transformers".

Python 2.3k 194
fpgaminer/GPTQ-triton fpgaminer/GPTQ-triton Public

GPTQ inference Triton kernel

Jupyter Notebook 321 22
Dao-AILab/flash-attention Dao-AILab/flash-attention Public

Fast and memory-efficient exact attention

Python 22.4k 2.4k