TensorRT on L4: 40% Latency Reduction with Simple MLP

Minimal demo: Optimize PyTorch MLP for L4 GPUs via TensorRT.

Quick Start

Setup	Latency (ms)	Reduction
PyTorch	0.40-0.60	Baseline
TRT FP16	0.20-0.30	40-50%

L4 Tips: Use g2-standard-4; monitor with nvidia-smi.

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
benchmarks		benchmarks
models		models
tensorrt		tensorrt
.gitignore		.gitignore
ReadMe.md		ReadMe.md
requirements.txt		requirements.txt