Achieve 15-20x performance improvement for vision/perception model inference

The performance (runtime) of any AI model is influenced by its size and precision. AI model developers spend time in optimizing the model size/architecture and precision to achieve better runtime performance. However, there is a limit to reducing model size and precision without losing model quality.

Name		Name	Last commit message	Last commit date
Latest commit History 20 Commits
README.md		README.md
cuda_helper.py		cuda_helper.py
cuda_kernels.py		cuda_kernels.py
fps_table.png		fps_table.png
gpu_decode_pre_post.py		gpu_decode_pre_post.py
gpu_decode_pre_post_batched_fp16.py		gpu_decode_pre_post_batched_fp16.py
gpu_decode_pre_post_fp16.py		gpu_decode_pre_post_fp16.py
gpu_pre_post.py		gpu_pre_post.py
naive_tensort.py		naive_tensort.py
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Achieve 15-20x performance improvement for vision/perception model inference

About

Uh oh!

Languages

mjayw2014/rvm_perf_inference

Folders and files

Latest commit

History

Repository files navigation

Achieve 15-20x performance improvement for vision/perception model inference

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Languages