Tags · PrismML-Eng/llama.cpp

prism-b8849-747eb36

Merge pull request #32 from Vort3xed/vulkan-q2_0-kernel

vulkan: Q2_0

May 19, 2026
747eb36
zip
tar.gz

prism-b8846-d104cf1

release-prism: install spirv-headers for ubuntu-arm64 vulkan build

Apr 19, 2026
d104cf1
zip
tar.gz
Notes
Downloads

prism-b8796-e2d6742

Remove Windows CUDA 12.8 (not supported by setup action)

Apr 14, 2026
e2d6742
zip
tar.gz
Notes
Downloads

prism-b8201-ba7e817

fix windows-hip artifact path

Apr 7, 2026
ba7e817
zip
tar.gz
Notes
Downloads

prism-b8196-f5dda72

Merge pull request #8 from PrismML-Eng/cpu-fixes

some cpu fixes; getting ready for upstream PR; e.g. id 40 is taken by…

Apr 2, 2026
f5dda72
zip
tar.gz
Notes
Downloads

prism-b8194-1179bfc

add slim release workflow for prism

Mar 25, 2026
1179bfc
zip
tar.gz
Notes
Downloads

prism-b8194-c3528ba

add slim release workflow for prism

Mar 24, 2026
c3528ba
zip
tar.gz

v0.0.2-prism

Merge pull request #1 from PrismML-Eng/mmq

[cuda] Fix mmq/mma path

Mar 19, 2026
bc8122e
zip
tar.gz

v0.0.1-prism

ggml: add Q1_0 and Q1_0_g128 1-bit quantization support (CPU, Metal, …

…CUDA)

Adds two 1-bit quantization types:
- Q1_0: block size 32, ~1.5 bpw
- Q1_0_g128: block size 128, ~1.125 bpw

Backend support: CPU (x86 SSE/AVX + ARM NEON), Metal, CUDA.
Kernel implementations follow Q4_0 as boilerplate, adapted for
1-bit sign-based dequantization.

CUDA MMQ kernels included but disabled (cuBLAS fallback used for
prompt processing) pending accuracy debugging.

Made-with: Cursor

Mar 2, 2026
59f2b84
zip
tar.gz

stable

ggml: add Q1_0 and Q1_0_g128 1-bit quantization support (CPU, Metal, …

…CUDA)

Adds two 1-bit quantization types:
- Q1_0: block size 32, ~1.5 bpw
- Q1_0_g128: block size 128, ~1.125 bpw

Backend support: CPU (x86 SSE/AVX + ARM NEON), Metal, CUDA.
Kernel implementations follow Q4_0 as boilerplate, adapted for
1-bit sign-based dequantization.

CUDA MMQ kernels included but disabled (cuBLAS fallback used for
prompt processing) pending accuracy debugging.

Made-with: Cursor

Mar 2, 2026
59f2b84
zip
tar.gz

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

prism-b8849-747eb36

prism-b8846-d104cf1

prism-b8796-e2d6742

prism-b8201-ba7e817

prism-b8196-f5dda72

prism-b8194-1179bfc

prism-b8194-c3528ba

v0.0.2-prism

v0.0.1-prism

stable

Tags: PrismML-Eng/llama.cpp