AI Gateway optimization

**Description**\nOptimize AI Gateway for latency and cost efficiency.\n\n**Tasks**\n- [ ] Implement response caching\n- [ ] Add request batching\n- [ ] Optimize prompt templates\n- [ ] Add rate limiting per tenant\n- [ ] Monitor token usage\n\n**Goals**\n- < 500ms p95 latency\n- 30% cost reduction through caching\n