scripts/example_inference.py

"""
Usage: python -m scripts.example_inference

Computes logits for a single sequence or with a batch of sequences.
"""
import torch

from evo import Evo

def main():

    # Load model.

    device = 'cuda:0'

    evo_model = Evo('evo-1-131k-base')
    model, tokenizer = evo_model.model, evo_model.tokenizer
    model.to(device)
    model.eval()

    # Example single-sequence inference.

    sequence = 'ACGT'
    input_ids = torch.tensor(
        tokenizer.tokenize(sequence),
        dtype=torch.int,
    ).to(device).unsqueeze(0)
    logits, _ = model(input_ids) # (batch, length, vocab)

    print('Logits: ', logits)
    print('Shape (batch, length, vocab): ', logits.shape)

    # Example batched inference.

    sequences = [
        'ACGT',
        'A',
        'AAAAACCCCCGGGGGTTTTT',
    ]

    from evo.scoring import prepare_batch

    input_ids, seq_lengths = prepare_batch(
        sequences,
        tokenizer,
        prepend_bos=False,
        device=device,
    )
    logits, _ = model(input_ids) # (batch, length, vocab)

    print('Batch logits: ', logits)
    print('Batch shape (batch, length, vocab): ', logits.shape)


if __name__ == '__main__':
    main()