Link al repositorio.
- Lenguaje usado: Python. Scikit-learn, Numpy, Pandas, Matplotlib.
- Análisis exploratorio de datos y preprocesamiento de datos.
- Comparación y selección de modelos de regresión y clasificación, incluyendo regresión lineal, KNN, árboles, ensambles de modelos y redes neuronales.
- Optimización de hiperparámetros y validación cruzada.
- Generación de informe técnico y presentación de resultados.
Link al repositorio.
- Lenguaje usado: R. MASS, caret, ggplot2, leaps, glmnet, gbm, dplyr.
- Análisis exploratorio de datos y preprocesamiento de datos.
- Regresión lineal: Búsqueda de modelos. Entrenamiento, regularización (Lasso), selección de modelos. Validación de supuestos y detección de datos atípicos.
- Árboles y métodos basados en árboles: Árboles crecidos, podados. Bagging, Random Forest, Boosting, XGBoost, BART.