Skip to content
View wSanice's full-sized avatar
🖖
A.S.A.P
🖖
A.S.A.P

Block or report wSanice

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don't include any personal information such as legal names or email addresses. Markdown supported. This note will be visible to only you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
wSanice/README.md

Hi there, I'm Sanice 🖖🏽

2nd arrow

Estudante de Data Science | Desenvolvedor Python | Univesp

Sou um estudante de Ciência de Dados apaixonado por transformar dados em soluções práticas. Combinando meu background em suporte de TI com desenvolvimento Python, estou focado em criar modelos de Machine Learning robustos e ferramentas que automatizam processos de dados, resolvendo problemas de forma criativa e definitiva.


Projetos em Destaque (Data Science & ML)

Bibliotecas & Ferramentas

  • Leblanc

    Synthetic Data Generator for Business Contexts Biblioteca Python open-source disponível no PyPI (pip install leblanc), desenvolvida para agilizar a etapa de coleta de dados em projetos.

    • Propósito: Elimina o boilerplate de criar geradores manuais com Faker, entregando datasets estruturados e coerentes para contextos de negócio (Varejo, Agro, Finanças).
    • Tech: Abstração de alto nível construída sobre Pandas e NumPy para performance na geração de grandes volumes de dados.

Machine Learning & Visão Computacional

  • Plant-AI (Em desenvolvimento)

    Diagnóstico de Doenças em Plantas Projeto de Visão Computacional utilizando Deep Learning para identificar doenças em plantas através de imagens. O modelo atingiu uma acurácia superior a 90%, visando auxiliar na agricultura de precisão.

  • CSIRO Biomass Prediction (Deep Learning)

    Computer Vision & Transfer Learning Strategy Pipeline completo de Deep Learning para prever biomassa a partir de imagens aéreas (Kaggle), atingindo score competitivo (0.40):

    • Data Engineering: Transformação de dados complexos ("long-to-wide") utilizando Pandas para estruturar o dataset de treino.
    • Modeling: Arquitetura TensorFlow/Keras baseada na EfficientNetB0. Implementação de estratégia de Transfer Learning em duas fases (Feature Extraction + Fine-Tuning progressivo) para evitar overfitting.
    • Deployment: Protótipo em Streamlit demonstrando o conceito "Multi-Input" (processamento simultâneo de Imagem + Metadados como NDVI).
  • Análise de E-commerce (Python)

    Data Analytics & Business Intelligence Estudo de caso focado em transformar dados brutos de transações em estratégia de negócio para escalabilidade.

    • Data Engineering: Geração de dataset sintético complexo com o módulo Leblanc e processamento de dados com Pandas.
    • EDA & Visualization: Análise exploratória profunda com Matplotlib e Seaborn para identificar tendências de sazonalidade e curva ABC de produtos.
    • Business Value: Mapeamento de oportunidades de expansão logística (PR/CE) e otimização de estoque de alto giro, consolidado em um relatório executivo (Storytelling).
  • Universal Churn Prediction Pipeline

    Automated ML Pipeline & Business Analytics Sistema inteligente de previsão de cancelamento (Churn) capaz de operar com dados reais e sintéticos (Gerados via leblanc).

    • Modeling: Treinamento automatizado de modelos Random Forest para identificar padrões de comportamento de risco.
    • Smart Pipeline: Algoritmo que detecta automaticamente a estrutura do dataset de entrada e adapta o pré-processamento (ETL).
    • Business Value: Entrega não apenas a previsão (0/1), mas um diagnóstico visual dos produtos e fatores financeiros que mais causam prejuízo.
  • Adaptive Image Classification (IALM)

    Imbalanced Adversarial Learning Estudo focado em classificação de imagens utilizando TensorFlow e Keras. O diferencial deste projeto é o tratamento de datasets desbalanceados usando técnicas de aprendizado adversarial (IALM), melhorando a performance do modelo em classes minoritárias.

Engenharia de Dados & Analytics

  • ETL Vendas Varejo & Dashboard

    Automated Data Pipeline (Python ➡️ Google Sheets) Solução de Business Intelligence completa (End-to-End) baseada no dataset Olist:

    • Back-end (ETL): Script Python que extrai e processa dados brutos usando Pandas. A automação carrega os dados tratados diretamente na nuvem via Google Sheets API (gspread).
    • Front-end (Analytics): Dashboard interativo construído com funções avançadas (QUERY, SUMIFS) para monitoramento de KPIs (Faturamento, Ticket Médio) com filtros dinâmicos. 🔗 Ver Dashboard ao Vivo
  • QuemCarrega.lol

    League of Legends Meta Analyzer & Dashboard Aplicação web Data-Driven (SPA) desenvolvida para análise de Win Rate e Pick Rate de campeões. O projeto integra todo o ciclo de dados:

    • ETL & Ingestion: Web Scraping e Engenharia Reversa de APIs (requests) para extração de dados em tempo real, contornando a ausência de endpoints públicos agregados.
    • Processing: Limpeza e agregação complexa de JSONs aninhados utilizando Pandas. Integração com Riot Games Data Dragon para versionamento.
    • Frontend: Dashboard interativo construído com Streamlit.
    • Infra: Deploy containerizado na Railway com Cloudflare (CDN/SSL).

Technologies & Tools

🔹 Programming Languages


python SQL

🔹 Data Science & Machine Learning Libraries


numpy pandas scikit-learn tensorflow opencv

🔹 Data Visualization & Analysis


powerbi matplotlib

Tools & Platforms

🔹 Cloud & Virtual Machines


aws google-cloud azure

🔹 Databases


mysql postgresql mongodb

🔹 Development Environments


jupyter colab kaggle pycharm vs-code

Operating Systems & Environment


ubuntu windows

Interests

  • Full-Cycle Data Science: Interesse em atuar em todas as etapas do fluxo de dados: desde a Criação de ETLs e Análise Exploratória até o Treinamento e Fine-tuning de modelos complexos.
  • AI Research: Exploração de últimas tendências em IA, especialmente Reinforcement Learning e Generative Models.
  • Data Engineering: Foco em criar pipelines eficientes e bibliotecas personalizadas para facilitar o fluxo de trabalho de dados.
  • Web Development: Aplicação de conhecimentos de Data Science em projetos Web, como o uuno.me e o quemcarrega.lol.

"Blind faith is the tool of monsters and fools. Analyze the data."

Pinned Loading

  1. etl_vendas_varejo_olist_sheets.ipynb etl_vendas_varejo_olist_sheets.ipynb Public

    Este repositório contém um notebook Python (.ipynb) que executa um processo de ETL (Extract, Transform, Load) completo. Este Notebook contem um script que foi responsável por extrair os dados bruto…

    Jupyter Notebook

  2. Biomass_Prediction_multi-imput Biomass_Prediction_multi-imput Public

    Este projeto implementa uma solução de ponta a ponta para a competição do Kaggle "CSIRO - Image2Biomass Prediction". O objetivo é desenvolver um modelo de Deep Learning (Visão Computacional) capaz …

    Python 1

  3. leblanc leblanc Public

    leblanc is a modular Python library designed for the rapid generation of large-scale synthetic datasets across various business sectors. It is primarily built using Pandas, NumPy, and Faker to crea…

    Python 1

  4. MotoboyOF/EFIBANK-API-PIX-PYTHON MotoboyOF/EFIBANK-API-PIX-PYTHON Public

    Ambiente de teste para testar a integração da API

    Python 3 1

  5. pycoder pycoder Public

    Assistente Pessoal de Programação Python

    Python

  6. Adaptive-Image-Classification-IALM Adaptive-Image-Classification-IALM Public

    AI CLassiifier Study

    Jupyter Notebook 1