Search Latency Bench

A performance benchmarking tool for evaluating response time characteristics across modern search APIs.

Quick Start

cp .env.example .env
# Edit .env with your API keys

Credentials needed:

EXA_API_KEY - Exa search API
BRAVE_API_KEY - Brave search API
PPLX_API_KEY - Perplexity search API
OPENAI_API_KEY - For query generation (optional)

Sample Queries

The repository includes 250 sample queries from MS MARCO in sample_queries/msmarco.jsonl to get started quickly.

Usage

Basic Benchmarks

# Test with included MS MARCO queries
uv run bench local --file sample_queries/queries_msmarco.jsonl --api all

# Test a single API
uv run bench local --file queries.jsonl --api exa-auto

# Sample subset of queries
uv run bench local --file queries.jsonl --num-queries 50 --api all

Performance Testing

# Parallel execution for higher throughput
uv run bench local --file queries.jsonl --api all --parallel --max-workers 20

Query Generation

# Generate synthetic queries with GPT-5-mini
uv run bench gen --count 100 --api all --parallel

HuggingFace Datasets

# Benchmark with MS MARCO queries
uv run bench dataset --name microsoft/ms_marco --config v2.1 --num-queries 1000 --api all

# Any HuggingFace dataset
uv run bench dataset \
  --name <dataset-name> \
  --query-field <field-name> \
  --num-queries 100 \
  --api exa-auto

Advanced Usage

uv run bench local \
  --file queries.jsonl \
  --api all \
  --num-queries 100 \
  --num-results 10 \
  --parallel \
  --max-workers 20 \
  --output results

API Options

exa-auto - Exa with auto mode
exa-fast - Exa with fast mode
brave - Brave Search
perplexity - Perplexity Search
all - Run all APIs sequentially

Input Formats

Supports JSON and JSONL query files:

["query 1", "query 2", "query 3"]

{"query": "query 1"}
{"query": "query 2"}

Results

Benchmarks generate timestamped JSON files with detailed performance metrics:

results/
├── exa-auto_results_20250110_143052.json
├── exa-fast_results_20250110_143052.json
├── brave_results_20250110_143052.json
└── perplexity_results_20250110_143052.json

Each result file includes:

Latency percentiles (P50, P90, P95, P99)
Aggregate statistics (min, max, mean)
Individual query timings
Success/failure counts
Execution metadata

Programmatic Usage

from search_latency_bench import ExaSearchEngine, run_benchmark
from search_latency_bench.engines.exa import SearchType

engine = ExaSearchEngine(type=SearchType.AUTO)
result = await run_benchmark(
    engine=engine,
    queries=["quantum computing", "climate change solutions"],
    num_results=10,
    api_name="exa-auto",
    parallel=True,
)

print(f"P50 latency: {result.summary.latency.p50:.1f}ms")
print(f"P95 latency: {result.summary.latency.p95:.1f}ms")
print(f"Success rate: {result.summary.successful_queries}/{result.summary.total_queries}")

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
sample_queries		sample_queries
search_latency_bench		search_latency_bench
.env.example		.env.example
.envrc		.envrc
.gitignore		.gitignore
.python-version		.python-version
README.md		README.md
flake.lock		flake.lock
flake.nix		flake.nix
pyproject.toml		pyproject.toml
screenshot.png		screenshot.png

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Search Latency Bench

Quick Start

Sample Queries

Usage

Basic Benchmarks

Performance Testing

Query Generation

HuggingFace Datasets

Advanced Usage

API Options

Input Formats

Results

Programmatic Usage

About

Uh oh!

Releases

Packages

Contributors 2

Uh oh!

Languages

exa-labs/search-latency-bench

Folders and files

Latest commit

History

Repository files navigation

Search Latency Bench

Quick Start

Sample Queries

Usage

Basic Benchmarks

Performance Testing

Query Generation

HuggingFace Datasets

Advanced Usage

API Options

Input Formats

Results

Programmatic Usage

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Uh oh!

Languages

Packages