Hugging Face Transformer Deployment Tutorial #49

fpetrini15 · 2023-09-22T20:05:53Z

Tutorials to show how hugging face transformers can be quickly deployed in Triton.

Quick_Deploy/HuggingFaceTransformers/base_text_classification_model.py

Quick_Deploy/HuggingFaceTransformers/build_server.py

Quick_Deploy/HuggingFaceTransformers/base_text_generation_model.py

… add README, restructure repo

Quick_Deploy/HuggingFaceTransformers/create_repository.py

Quick_Deploy/HuggingFaceTransformers/text_generation/config.pbtxt

Quick_Deploy/HuggingFaceTransformers/README.md

…er-tutorials

fpetrini15 · 2023-10-03T19:36:03Z

All generation scripts were removed and replaced with static files. This new tutorial covers deploying falcon7b, persimmon-8b, and mistral 7b. Down the road, these models may get there own READMEs in a "Popular Models Guide" folder cc @jbkyang-nvi.

Quick_Deploy/HuggingFaceTransformers/README.md

Quick_Deploy/HuggingFaceTransformers/Dockerfile

Quick_Deploy/HuggingFaceTransformers/README.md

Quick_Deploy/HuggingFaceTransformers/falcon7b/1/model.py

…er-tutorials

fpetrini15 · 2023-10-06T16:49:43Z

@nnshah1. I preemptively removed Mistral from the tutorial. I can always revert if necessary.

…er-tutorials

fpetrini15 · 2023-10-15T23:59:11Z

Incorporated some feedback from Dora incorporating how to gather performance metrics, load cached models, and adding comments.

Quick_Deploy/HuggingFaceTransformers/persimmon8b/1/model.py

Quick_Deploy/HuggingFaceTransformers/falcon7b/1/model.py

Quick_Deploy/HuggingFaceTransformers/persimmon8b/config.pbtxt

Quick_Deploy/HuggingFaceTransformers/falcon7b/config.pbtxt

Quick_Deploy/HuggingFaceTransformers/README.md

Quick_Deploy/HuggingFaceTransformers/falcon7b/config.pbtxt

Quick_Deploy/HuggingFaceTransformers/README.md

fpetrini15 · 2023-10-20T20:44:43Z

CC @nv-braf @matthewkotila in case there is any feedback regarding the PA/MA section.

Quick_Deploy/HuggingFaceTransformers/falcon7b/1/model.py

matthewkotila · 2023-10-23T18:34:23Z

PA stuff LGTM 👍

) * Initial Commit * Mount model repo so changes reflect, parameter tweaking, README file * Image name error * Incorporating review comments. Separate docker and model repo builds, add README, restructure repo * Tutorial restructuring. Using static model configurations * Bump triton container and update README * Remove client script * Incorporating review comments * Modify WIP line in vLLM tutorial * Remove trust_remote_code parameter from falcon model * Removing Mistral * Incorporating Feedback * Change input/output names * Pre-commit format * Different perf_analyzer example, config file format fixes * Deep dive changes to Triton tools section * Remove unused variable

fpetrini15 added 2 commits September 22, 2023 13:00

Initial Commit

4c40127

Mount model repo so changes reflect, parameter tweaking, README file

ce7145b

fpetrini15 requested review from rmccorm4, tanmayv25 and nnshah1 September 22, 2023 23:51

Image name error

b89387b

nnshah1 reviewed Sep 23, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/base_text_classification_model.py Outdated Show resolved Hide resolved

nnshah1 reviewed Sep 23, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/base_text_classification_model.py Outdated Show resolved Hide resolved

nnshah1 reviewed Sep 23, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/build_server.py Outdated Show resolved Hide resolved

nnshah1 reviewed Sep 23, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/base_text_generation_model.py Outdated Show resolved Hide resolved

Incorporating review comments. Separate docker and model repo builds,…

c5b34d7

… add README, restructure repo

rmccorm4 reviewed Sep 27, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/create_repository.py Outdated Show resolved Hide resolved

rmccorm4 reviewed Sep 27, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/text_generation/config.pbtxt Outdated Show resolved Hide resolved

rmccorm4 reviewed Sep 27, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/text_generation/config.pbtxt Outdated Show resolved Hide resolved

yeahdongcn reviewed Sep 28, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/README.md Show resolved Hide resolved

nnshah1 reviewed Sep 28, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/README.md Outdated Show resolved Hide resolved

fpetrini15 added 5 commits September 29, 2023 16:35

Merge remote-tracking branch 'origin/main' into fpetrini-hf-transform…

7173dc8

…er-tutorials

Tutorial restructuring. Using static model configurations

28fb995

Merge remote-tracking branch 'origin/main' into fpetrini-hf-transform…

db04d14

…er-tutorials

Bump triton container and update README

266df4e

Remove client script

922a29c

fpetrini15 requested review from nnshah1 and rmccorm4 October 3, 2023 19:36

rmccorm4 reviewed Oct 3, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/README.md Outdated Show resolved Hide resolved

rmccorm4 reviewed Oct 3, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/Dockerfile Outdated Show resolved Hide resolved

rmccorm4 reviewed Oct 3, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/README.md Outdated Show resolved Hide resolved

rmccorm4 reviewed Oct 3, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/README.md Outdated Show resolved Hide resolved

rmccorm4 reviewed Oct 3, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/README.md Outdated Show resolved Hide resolved

rmccorm4 reviewed Oct 3, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/README.md Outdated Show resolved Hide resolved

fpetrini15 added 2 commits October 3, 2023 17:13

Incorporating review comments

b1b0b28

Modify WIP line in vLLM tutorial

d96cf9e

rmccorm4 reviewed Oct 4, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/falcon7b/1/model.py Outdated Show resolved Hide resolved

fpetrini15 added 3 commits October 4, 2023 11:14

Remove trust_remote_code parameter from falcon model

20d027d

Merge remote-tracking branch 'origin/main' into fpetrini-hf-transform…

8a26eb4

…er-tutorials

Removing Mistral

9e16029

fpetrini15 added 2 commits October 15, 2023 16:56

Merge remote-tracking branch 'origin/main' into fpetrini-hf-transform…

dc3de39

…er-tutorials

Incorporating Feedback

b68af63

github-advanced-security bot found potential problems Oct 16, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/persimmon8b/1/model.py Fixed Show fixed Hide fixed

Quick_Deploy/HuggingFaceTransformers/falcon7b/1/model.py Fixed Show fixed Hide fixed

nnshah1 reviewed Oct 16, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/persimmon8b/config.pbtxt Outdated Show resolved Hide resolved

nnshah1 reviewed Oct 16, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/falcon7b/config.pbtxt Outdated Show resolved Hide resolved

fpetrini15 added 2 commits October 16, 2023 09:53

Change input/output names

09b0ee2

Pre-commit format

036955c

rmccorm4 reviewed Oct 16, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/README.md Outdated Show resolved Hide resolved

rmccorm4 reviewed Oct 16, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/falcon7b/config.pbtxt Outdated Show resolved Hide resolved

Different perf_analyzer example, config file format fixes

d02698a

rmccorm4 reviewed Oct 17, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/README.md Show resolved Hide resolved

rmccorm4 reviewed Oct 17, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/README.md Outdated Show resolved Hide resolved

rmccorm4 reviewed Oct 17, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/README.md Outdated Show resolved Hide resolved

Deep dive changes to Triton tools section

9e86af0

github-advanced-security bot found potential problems Oct 20, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/falcon7b/1/model.py Fixed Show fixed Hide fixed

Remove unused variable

1a0d05d

jbkyang-nvi approved these changes Oct 24, 2023

View reviewed changes

tanmayv25 merged commit de7da4a into main Oct 24, 2023

fpetrini15 deleted the fpetrini-hf-transformer-tutorials branch October 24, 2023 00:50

Hugging Face Transformer Deployment Tutorial #49

Hugging Face Transformer Deployment Tutorial #49

Uh oh!

Conversation

fpetrini15 commented Sep 22, 2023

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

fpetrini15 commented Oct 3, 2023

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

fpetrini15 commented Oct 6, 2023

Uh oh!

fpetrini15 commented Oct 15, 2023

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

fpetrini15 commented Oct 20, 2023

Uh oh!

Uh oh!

matthewkotila commented Oct 23, 2023

Uh oh!

Uh oh!