+ 🎓 Cientista de Dados | FATEC
+ 🔧 Especialista em MLOps e Site Reliability Engineering
+ ☁️ Google Cloud Platform (GCP) e Kubernetes
+ 📊 Transformando modelos em produtos escaláveis e confiáveisMinha missão: Construir sistemas de IA que não apenas funcionam no notebook, mas operam com confiabilidade de 99.9% em produção.
📖 Leia mais sobre minha trajetória
Sou Cientista de Dados formado pela FATEC e dedico minha carreira a aplicar habilidades analíticas para construir sistemas de IA robustos, confiáveis e escaláveis.
Meu principal diferencial é a capacidade de transitar fluidamente entre a modelagem estatística complexa e a engenharia de software de alta performance. Minha abordagem vai além do simples treinamento de modelos; eu me concentro em projetar, construir e validar a infraestrutura completa de MLOps e Dados para garantir que as soluções operem com máxima confiabilidade e eficiência no mundo real.
O que me move:
- 🎯 Resolver problemas complexos de escalabilidade e confiabilidade
- 🚀 Automatizar pipelines end-to-end (do dado bruto ao modelo em produção)
- 📈 Otimizar custos de infraestrutura (FinOps) sem comprometer performance
- 🤝 Compartilhar conhecimento através de documentação técnica de qualidade
| 🚀 Deploys Automatizados | ☁️ Clusters Gerenciados | 📊 TB de Dados Processados | ⚡ APIs em Produção |
|---|---|---|---|
| 15+ | 3+ | 10+ TB | 5+ |
Atuo na interseção entre Data Science, MLOps e SRE (Site Reliability Engineering), transformando protótipos em produtos resilientes.
|
|
|
|
Stack: GKE Docker FastAPI GitHub Actions Helm
Solução completa de deploy para API de Churn Prediction rodando em Cluster Kubernetes (GKE) com máxima confiabilidade e segurança.
✨ Highlights:
- 🔐 Autenticação OIDC (Keyless Security)
- ⚡ Load Balancer com Auto-scaling horizontal
- 🔄 CI/CD Pipeline para deploy contínuo
- 📊 Monitoramento com Prometheus e Grafana
- 🛡️ Health Checks e Readiness Probes
📂 Ver Repositório | 📖 Documentação Técnica
Stack: GCP BigQuery SQL Looker Parquet
Arquitetura de dados moderna transformando dados brutos de Táxis de NY (200M+ registros) em insights de negócio através de modelagem dimensional.
✨ Highlights:
- 📊 Window Functions para análise temporal
- 💰 Particionamento para otimização de custos
- 🔍 Índices estratégicos para consultas sub-segundo
- 📈 Dashboards executivos no Looker Studio
- ⚡ Performance tuning (redução de 70% no tempo de query)
📂 Ver Repositório | 📊 Dashboard Demo
Stack: Kafka Kubernetes Strimzi Prometheus Locust
Análise profunda de performance de cluster Kafka para otimizar ingestão de dados em larga escala. Estudo completo de throughput vs. latência.
✨ Highlights:
- 📈 Stress Testing com 10K+ msgs/sec
- 🎯 Tuning de produtores e consumidores
- 📊 Observabilidade completa (Prometheus + Grafana)
- 💡 Redução de 40% no consumo de memória (KRaft Mode)
- 📝 Documentação de ADRs (Architecture Decision Records)
📂 Ver Repositório | 📈 Resultados
Stack: Apache Spark Kafka Docker NLTK VADER Pandas UDF
Pipeline de streaming completo para análise de sentimentos em tempo real com latência sub-segundo. Arquitetura event-driven otimizada para FinOps.
✨ Highlights:
- ⚡ Pandas UDF (3-100x mais rápido que UDFs tradicionais)
- 💰 Kafka KRaft Mode (redução de 40% em RAM)
- 🔄 Exactly-once semantics com checkpointing
- 🐳 Limites de recursos definidos (FinOps)
- 📊 Throughput: ~200 msgs/seg
📂 Ver Repositório | 🎬 Demo Visual
Stack: GitHub Actions Python BeautifulSoup Cron Jobs
Bot de coleta de dados (News Scraping) com ciclo completo de GitOps. Execução automatizada, tratamento de falhas e versionamento de dados.
✨ Highlights:
- ⏰ Cron Job automatizado (execução diária)
- 🔄 Versionamento de dados no Git
- 🛡️ Error Handling robusto
- 📊 Logs estruturados para auditoria
- 🚀 Zero servidor (serverless via GitHub Actions)
| Curso | Emissor | Conclusão |
|---|---|---|
| BigQuery for Data Analysts | Fev 2025 | |
| Build and Deploy ML Solutions on Vertex AI | Jan 2025 | |
| Hadoop Foundations - Level 1 | Dez 2024 | |
| Fundamentos de Eng. de Dados | Abr 2025 |
| Curso | Emissor | Conclusão |
|---|---|---|
| Power BI para Business Intelligence | Set 2025 | |
| Machine Learning Operations (MLOps) | Out 2024 | |
| Data Analytics | Fev 2025 |
| Título / Grau | Instituição | Status |
|---|---|---|
| Cientista de Dados | Em andamento | |
| Engenharia Elétrica | Concluído | |
| Inglês Proficiente (C1) | 63/100 |
| Projeto | Tipo | Contribuição | Status |
|---|---|---|---|
| Apache Kafka | Issue Report | Documentação de edge case em producers | 🔄 Aberto |
| Strimzi Operator | Discussion | Boas práticas de tuning de performance | ✅ Aceito |
| FastAPI | Issue Report | K8s deployment best practices | 🔄 Em discussão |
💡 Contribua comigo: Se você tem projetos open source relacionados a MLOps, Data Engineering ou SRE, adoraria colaborar!
📌 Tópicos planejados:
- Como Reduzir 40% do Custo de Infraestrutura com Kafka KRaft
- MLOps na Prática: De Jupyter Notebook para GKE em 30 minutos
- Pandas UDF vs UDFs Tradicionais: Benchmark Real de Performance
- Site Reliability Engineering para Pipelines de Dados
🚀 Consultorias em MLOps e Cloud Architecture
💼 Oportunidades de colaboração em projetos desafiadores
🎤 Palestras técnicas sobre SRE e Data Engineering
🤝 Mentorias em Data Science e MLOps
