Torchserve Embedders

Overview

The repository contains code for running two models (text and image embedders) with torchserve.

Usage

Installing dependencies

git clone https://github.com/pytorch/serve.git

cd serve
python ./ts_scripts/install_dependencies.py --cuda=cu121

pip install -r requirements.txt

Download models from HuggingFace

export HF_HOME=<folder for storing models>
export HF_HUB_CACHE=<folder for storing models>
huggingface-cli download sentence-transformers/paraphrase-multilingual-mpnet-base-v2 sentence-transformers/clip-ViT-B-32

Check the models, save them to .bin files

python convert_models_to_bin.py

Create .mar files from models for serving using handler files

. scripts/create_mar_files.sh

Specify the necessary parameters in config.properties, start the server

. scripts/torchserve_start.sh

Measuring performance using locustfile.py

. scripts/locust_test.sh

Examples of sending requests:

curl -X POST http://127.0.0.1:9980/predictions/text_embedder -T ./sample_text.txt
curl -X POST http://127.0.0.1:9980/predictions/image_embedder -T ./sample_image.jpg

Performance Tests For two separate models with 1 worker:

batchSize=8 - 520 rps
batchSize=16 - 550 rps
batchSize=32 - 580 rps

When running both models simultaneously, the best result of 460 rps is achieved with batchSize=8.

TODO

try optimizing models via TensorRT/ONNX
before sending the image to the model, resize it to the input size of the model (to reduce the amount of bytes sent)
optimize data transfer - use pickle and imageio
pass metrics to Prometheus
use docker/docker-compose

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Torchserve Embedders

Overview

Usage

About

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
scripts		scripts
README.md		README.md
config.properties		config.properties
convert_models_to_bin.py		convert_models_to_bin.py
image_embedder_handler.py		image_embedder_handler.py
locustfile.py		locustfile.py
models_info.json		models_info.json
requirements.txt		requirements.txt
sample_image.jpg		sample_image.jpg
sample_text.txt		sample_text.txt
text_embedder_handler.py		text_embedder_handler.py

PlaeryinBol/Torchserve_Embedders

Folders and files

Latest commit

History

Repository files navigation

Torchserve Embedders

Overview

Usage

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages