Este projeto apresenta uma série de notebooks desenvolvidos no Google Colab que aplicam técnicas de machine learning para resolver problemas de classificação. A ênfase é dada em algoritmos de classificação e análise de dados, visando a criação de modelos replicáveis e a comparação entre métodos lineares e não lineares.
- Google Colab: Ambiente de desenvolvimento baseado em nuvem para Jupyter notebooks.
- Python: Linguagem de programação principal.
- Bibliotecas de Machine Learning:
scikit-learn
para modelos de aprendizado de máquina.pandas
para manipulação de dados.numpy
para computação numérica.matplotlib
eseaborn
para visualização de dados.
- Introdução à Classificação: Implementação de um modelo de classificação básico e práticas de padronização de nomes.
- Testes Replicáveis e Estratificação: Técnicas para garantir que os testes sejam replicáveis e estratégias para lidar com dados desbalanceados.
- Análise de Baixa Dimensionalidade: Visualização e interpretação de modelos em duas dimensões.
- Support Vector Machines (SVM): Exploração do modelo SVC e sua capacidade de lidar com não linearidade nos dados.
- Dummy Classifiers e Árvores de Decisão: Comparação entre modelos simples e complexos, e visualização das decisões de um estimador.