Verifier Primacy

Logprobs analysis toolkit for local LLMs on Apple Silicon.

Claude Code Skill

/logprobs "The capital of France is"

Analyze token probabilities, confidence scores, and alternatives from local MLX models.

Modes

Complete (default) - Generate and analyze confidence

/logprobs "The capital of France is"

Score - Evaluate likelihood of existing text

/logprobs --mode score "The capital" --continuation " of France"

Compare - Rank multiple continuations

/logprobs --mode compare "The answer is" --alternatives " Paris" " London" " Berlin"

Output Metrics

Metric	What it tells you
Perplexity	Overall quality (A: <1.5, B: 1.5-3, C: 3-6, D: >6)
Confidence %	Per-token certainty (High >70%, Med 40-70%, Low <40%)
Alternatives	What the model almost said at each position

Example Output

Prompt: "The capital of France is"
Output: "**Paris**."

Perplexity: 1.01 (EXCELLENT)
Avg Confidence: 99% (HIGH)
Uncertain Tokens: 0 of 10 (0%)

Options

--think - Enable Qwen3 thinking mode (disabled by default)
--max-tokens N - Limit generation length
--top-k N - Number of alternatives to show
--json - Output as JSON
--model <path> - Use different MLX model

Installation

# With uv (recommended)
uv sync

# Or pip
pip install -e ".[mlx]"

Requires Apple Silicon for MLX backend.

Python API

from verifier_primacy.logprobs import LogprobsExplorer

explorer = LogprobsExplorer.from_pretrained("mlx-community/Qwen3-4B-4bit")

# Generate with confidence analysis
result = explorer.complete("The capital of France is", max_tokens=20)
print(f"Output: {result.completion}")
print(f"Perplexity: {result.perplexity:.2f}")

# Score existing text
score = explorer.get_logprobs("Hello", " world")
print(f"Likelihood: {score.perplexity:.2f}")

# Compare alternatives
comparison = explorer.compare_continuations(
    "The best programming language is",
    [" Python", " JavaScript", " Rust"]
)
print(f"Model prefers: {comparison.best.text}")

Coming Soon

Constrained decoding via logit-level verification
Schema-guided generation
Human-in-the-loop routing

Development

git clone https://github.com/andrewBatutin/verifier_primacy
cd verifier_primacy
uv sync
uv run pytest

License

MIT

Name		Name	Last commit message	Last commit date
Latest commit History 34 Commits
.claude		.claude
examples		examples
scripts		scripts
skills/logprobs		skills/logprobs
src/verifier_primacy		src/verifier_primacy
tests		tests
.gitattributes		.gitattributes
.gitignore		.gitignore
CLAUDE.md		CLAUDE.md
README.md		README.md
RESTRUCTURE_PLAN.md		RESTRUCTURE_PLAN.md
logprobs_output.json		logprobs_output.json
marketplace.json		marketplace.json
pyproject.toml		pyproject.toml
uv.lock		uv.lock

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Verifier Primacy

Claude Code Skill

Modes

Output Metrics

Example Output

Options

Installation

Python API

Coming Soon

Development

License

About

Uh oh!

Releases

Packages

Languages

andrewBatutin/verifier_primacy

Folders and files

Latest commit

History

Repository files navigation

Verifier Primacy

Claude Code Skill

Modes

Output Metrics

Example Output

Options

Installation

Python API

Coming Soon

Development

License

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages