Objetivo: Analizar el comportamiento de los usuarios que abandonan el carrito de compras en un sitio web de e-commerce para identificar posibles razones y proponer estrategias de retención.
- Colaboradores y Stack del Proyecto
- Instalación y Ejecución
- Estructura del Proyecto
- Streamlit Web App Docs
- Raphael Nicaise: Data Engineer & Project Manager
- Ruth Estefania Puyo: Data Analyst & BI Analyst
- Pamela Cardozo: Data Analyst
- Leando Matias Luna: ML Developer
- Yalideth Sánchez: Data Analyst
- Clonar el repositorio
git clone https://github.com/No-Country-simulation/c21-57-t-data-bi
- Crear un entorno virtual en la carpeta raiz del proyecto
pip install virtualenv
python -m venv venv
./venv/Scripts/activate
pip install -r requirements.txt
- (Local) Ejecutar la aplicación Streamlit
- (Aunque la pagina este deployada en la nube, se puede ejecutar localmente)
streamlit run app.py
- (Cloud) Ejecutar el ETL
- Crear cuenta en Prefect Cloud y crear un proyecto.
- Copiar el API Key y ejecutar el siguiente comando:
prefect cloud login -k <API_KEY>
- Ejecutar el flujo de trabajo:
py data_engineer/main.py
c21-57-t-data-bi
├───/data
│ ├───/bronze
│ ├───/gold
│ └───/silver
├───/data_analysts_bi
├───/data_engineer
├───/ml_developers
├──app.py
└──requirements.txt
El proyecto se divide en 4 carpetas principales:
- /data: Data Lake con los datos en diferentes niveles de procesamiento. (Medallion Methodology):
- 🔸/bronze: Datos en bruto.
- 🔹/silver: Datos procesados y limpios.
- 🌟/gold: Datos finales extras y/o de analisis.
- /data_analysts_bi: Contiene los notebooks de los analistas de datos y BI.
- /data_engineer: Contiene el flujo de trabajo del ETL.
- /ml_developers: Contiene los notebooks de los desarrolladores de ML.
Ademas, el proyecto cuenta con:
- Un archivo app.py que contiene la aplicación web de Streamlit
- Un archivo requirements.txt con las dependencias del proyecto.
En la aplicación web de Streamlit se pueden encontrar las siguientes secciones:
- Informacion: Donde se encuentra este mismo README.MD.
- Consultas: Seccion donde tenemos algunos filtros para consultar datos.
- Visualizaciones: Seccion donde se encuentran las visualizaciones de los datos.
- Resultados del Modelo: Seccion donde se encuentran los resultados del modelo de ML. Se encuentran tanto graficos, como un carrito simulado en el que podemos predecir si, el carrito va a ser concretado o cancelado.