Sou um estudante de Ciência de Dados apaixonado por transformar dados em soluções práticas. Combinando meu background em suporte de TI com desenvolvimento Python, estou focado em criar modelos de Machine Learning robustos e ferramentas que automatizam processos de dados, resolvendo problemas de forma criativa e definitiva.
- Leblanc
Synthetic Data Generator for Business Contexts Biblioteca Python open-source disponível no PyPI (
pip install leblanc), desenvolvida para agilizar a etapa de coleta de dados em projetos.- Propósito: Elimina o boilerplate de criar geradores manuais com
Faker, entregando datasets estruturados e coerentes para contextos de negócio (Varejo, Agro, Finanças). - Tech: Abstração de alto nível construída sobre Pandas e NumPy para performance na geração de grandes volumes de dados.
- Propósito: Elimina o boilerplate de criar geradores manuais com
-
Plant-AI (Em desenvolvimento)
Diagnóstico de Doenças em Plantas Projeto de Visão Computacional utilizando Deep Learning para identificar doenças em plantas através de imagens. O modelo atingiu uma acurácia superior a 90%, visando auxiliar na agricultura de precisão.
-
CSIRO Biomass Prediction (Deep Learning)
Computer Vision & Transfer Learning Strategy Pipeline completo de Deep Learning para prever biomassa a partir de imagens aéreas (Kaggle), atingindo score competitivo (0.40):
- Data Engineering: Transformação de dados complexos ("long-to-wide") utilizando Pandas para estruturar o dataset de treino.
- Modeling: Arquitetura TensorFlow/Keras baseada na EfficientNetB0. Implementação de estratégia de Transfer Learning em duas fases (Feature Extraction + Fine-Tuning progressivo) para evitar overfitting.
- Deployment: Protótipo em Streamlit demonstrando o conceito "Multi-Input" (processamento simultâneo de Imagem + Metadados como NDVI).
-
Análise de E-commerce (Python)
Data Analytics & Business Intelligence Estudo de caso focado em transformar dados brutos de transações em estratégia de negócio para escalabilidade.
- Data Engineering: Geração de dataset sintético complexo com o módulo Leblanc e processamento de dados com Pandas.
- EDA & Visualization: Análise exploratória profunda com Matplotlib e Seaborn para identificar tendências de sazonalidade e curva ABC de produtos.
- Business Value: Mapeamento de oportunidades de expansão logística (PR/CE) e otimização de estoque de alto giro, consolidado em um relatório executivo (Storytelling).
-
Universal Churn Prediction Pipeline
Automated ML Pipeline & Business Analytics Sistema inteligente de previsão de cancelamento (Churn) capaz de operar com dados reais e sintéticos (Gerados via leblanc).
- Modeling: Treinamento automatizado de modelos Random Forest para identificar padrões de comportamento de risco.
- Smart Pipeline: Algoritmo que detecta automaticamente a estrutura do dataset de entrada e adapta o pré-processamento (ETL).
- Business Value: Entrega não apenas a previsão (0/1), mas um diagnóstico visual dos produtos e fatores financeiros que mais causam prejuízo.
-
Adaptive Image Classification (IALM)
Imbalanced Adversarial Learning Estudo focado em classificação de imagens utilizando TensorFlow e Keras. O diferencial deste projeto é o tratamento de datasets desbalanceados usando técnicas de aprendizado adversarial (IALM), melhorando a performance do modelo em classes minoritárias.
-
Automated Data Pipeline (Python ➡️ Google Sheets) Solução de Business Intelligence completa (End-to-End) baseada no dataset Olist:
- Back-end (ETL): Script Python que extrai e processa dados brutos usando Pandas. A automação carrega os dados tratados diretamente na nuvem via Google Sheets API (gspread).
- Front-end (Analytics): Dashboard interativo construído com funções avançadas (
QUERY,SUMIFS) para monitoramento de KPIs (Faturamento, Ticket Médio) com filtros dinâmicos. 🔗 Ver Dashboard ao Vivo
-
League of Legends Meta Analyzer & Dashboard Aplicação web Data-Driven (SPA) desenvolvida para análise de Win Rate e Pick Rate de campeões. O projeto integra todo o ciclo de dados:
- ETL & Ingestion: Web Scraping e Engenharia Reversa de APIs (
requests) para extração de dados em tempo real, contornando a ausência de endpoints públicos agregados. - Processing: Limpeza e agregação complexa de JSONs aninhados utilizando Pandas. Integração com Riot Games Data Dragon para versionamento.
- Frontend: Dashboard interativo construído com Streamlit.
- Infra: Deploy containerizado na Railway com Cloudflare (CDN/SSL).
- ETL & Ingestion: Web Scraping e Engenharia Reversa de APIs (
- Full-Cycle Data Science: Interesse em atuar em todas as etapas do fluxo de dados: desde a Criação de ETLs e Análise Exploratória até o Treinamento e Fine-tuning de modelos complexos.
- AI Research: Exploração de últimas tendências em IA, especialmente Reinforcement Learning e Generative Models.
- Data Engineering: Foco em criar pipelines eficientes e bibliotecas personalizadas para facilitar o fluxo de trabalho de dados.
- Web Development: Aplicação de conhecimentos de Data Science em projetos Web, como o uuno.me e o quemcarrega.lol.
"Blind faith is the tool of monsters and fools. Analyze the data."




