Jecq

Jecq (Just Enough Compression & Quantization) is an open-source C++ library by Janea Systems for efficient similarity search of dense vectors. It is designed as a drop-in replacement for Faiss, Meta’s popular library for fast vector similarity search. Jecq introduces advanced, dimension-aware compression techniques that significantly reduce memory footprint while maintaining high search accuracy. Complete wrappers for Python/numpy are provided.

Key Features

Dimension-Aware Compression

Jecq analyzes the statistical relevance of each vector dimension and applies varying levels of quantization, achieving high levels of compression while retaining high search accuracy. See STATISTICS.md for an example of this in action against a sample dataset.

Faiss Compatibility

Provides two Faiss-compatible indices:

jecq::IndexJecq – drop-in replacement for faiss::IndexPQ
jecq::IndexIVFJecq – drop-in replacement for faiss::IndexIVFPQ

Hyper-Parameter Optimization

Includes a bundled optimizer to help users select hyper-parameters that best balance compression ratio and search accuracy for their data.

CPU Implementation

Written in C++ for CPUs; currently no GPU support.

Why Use Jecq?

Reduced Storage + High Accuracy

In our tests against a sample dataset, using IndexPQ as a benchmark, we achieved a compression ratio of 15.9% (~6x compression) while retaining ~85% search accuracy.

Easy Integration

Seamlessly integrates with existing Faiss-based pipelines and vector databases.

How Jecq Compression Works

Jecq’s approach is based on the observation that not all vector dimensions contribute equally to search relevance. Instead of applying uniform compression, Jecq:

Analyzes variance by computing the eigenvalues of the covariance matrix from training data to measure the statistical relevance (variance) of each dimension.
Encodes dimensions according to three categories:
1. High Variance features are encoded with Product Quantization (PQ), using as many sub-quantizers as dimensions, with 8 bits per dimension.
2. Medium Variance features are encoded with Iterative Quantization (ITQ), with 1 bit per dimension.
3. Low Variance features are discarded (0 bits per dimension).
Stores compressed vectors in a custom, compact format accessible via a lightweight API.

This non-uniform, relevance-based quantization enables aggressive compression without sacrificing mission-critical search signals.

Search Functionality

Distance Metric: Supports inner product distance only.

$$\mathrm{search\_distance}(q, v) = \mathrm{ip\_distance}_{\mathrm{pq\_features}}(q, v)\,\times\,\mathrm{pq\_multiplier} \;+\; \mathrm{ip\_distance}_{\mathrm{itq\_features}}(q, v)$$

Hyper-parameters:

pq_multiplier: Weight for PQ features in search distance calculation.
th_high: Variance threshold above which features are PQ-encoded.
th_mid: Variance threshold below which features are discarded.

Note: "Variance" here refers to eigenvalues from the covariance matrix, not naive sample variance.

Installation

Jecq is distributed with precompiled Python libraries. The core is implemented in C++ and requires only a BLAS implementation. Compiles with CMake. See INSTALL.md for step-by-step instructions.

Use Cases

Retrieval-augmented generation (RAG)
Recommendation engines
Semantic search
Edge AI and IoT deployments
Cost-sensitive enterprise AI search

Crafted with ❤️ by Janea Systems

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
.github/workflows		.github/workflows
.vscode		.vscode
cmake		cmake
demos		demos
faiss @ aad35f8		faiss @ aad35f8
jecq		jecq
tests		tests
.clang-format		.clang-format
.flake8		.flake8
.gitattributes		.gitattributes
.gitignore		.gitignore
.gitmodules		.gitmodules
.pre-commit-config.yaml		.pre-commit-config.yaml
CMakeLists.txt		CMakeLists.txt
CONTRIBUTING.md		CONTRIBUTING.md
Dockerfile.linux		Dockerfile.linux
INSTALL.md		INSTALL.md
LICENSE		LICENSE
README.md		README.md
STATISTICS.md		STATISTICS.md
build.ps1		build.ps1
build.sh		build.sh
build_demo.ps1		build_demo.ps1
build_demo.sh		build_demo.sh
install_mkl.sh		install_mkl.sh
install_requirements.sh		install_requirements.sh
memory_usage_compare.png		memory_usage_compare.png
mypy.ini		mypy.ini
requirements.linux		requirements.linux

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Jecq

Key Features

Dimension-Aware Compression

Faiss Compatibility

Hyper-Parameter Optimization

CPU Implementation

Why Use Jecq?

Reduced Storage + High Accuracy

Easy Integration

How Jecq Compression Works

Search Functionality

Hyper-parameters:

Installation

Use Cases

About

Uh oh!

Releases 1

Packages

Contributors 2

Uh oh!

Languages

License

JaneaSystems/jecq

Folders and files

Latest commit

History

Repository files navigation

Jecq

Key Features

Dimension-Aware Compression

Faiss Compatibility

Hyper-Parameter Optimization

CPU Implementation

Why Use Jecq?

Reduced Storage + High Accuracy

Easy Integration

How Jecq Compression Works

Search Functionality

Hyper-parameters:

Installation

Use Cases

About

Topics

Resources

License

Contributing

Uh oh!

Stars

Watchers

Forks

Releases 1

Packages 0

Contributors 2

Uh oh!

Languages

Packages