Este es mi perfil de Github, donde iré subiendo ideas y proyectos sobre Ingeniería de Datos y Ciencia de Datos 🔥🔥
Pinned Loading
-
Streaming-data-with-Kafka-Spark-and-S3
Streaming-data-with-Kafka-Spark-and-S3 PublicCanalización de datos en tiempo real con Apache Kafka, procesamiento con Spark Streaming y storage en un bucket de Amazon S3.
Python
-
Big-Data-with-Spark-MLlib-and-Databricks
Big-Data-with-Spark-MLlib-and-Databricks PublicPredicción de incumplimiento crediticio con algoritmo de Spark MLlib Gradient Boosting Trees, usando cluster de procesamiento de Databricks.
Jupyter Notebook
-
Data-Lakehouse-with-Amazon-S3-and-Redshift
Data-Lakehouse-with-Amazon-S3-and-Redshift PublicCanalización desde MongoDB hacia un Data Lake de Amazon S3, creación de Data Warehouse en Amazon Redshift y visualización en Tableau.
Python
-
ETL-with-Airflow-and-Docker
ETL-with-Airflow-and-Docker PublicProceso ETL desde CSV, orquestado con Apache Airflow en contenedores Docker, almacenamiento en PostgeSQL y visualización en Power BI.
Python
-
ETL-parameterizable-with-OmegaConf
ETL-parameterizable-with-OmegaConf PublicETL parameterizable con librería OmegaConf
Python
-
API-REST-with-Python-and-FastAPI
API-REST-with-Python-and-FastAPI PublicAPI REST construída con framework FastAPI y web server Uvicorn, usando esquemas de validación Pydantic y testeando con VSCode Thunder Client.
Python
If the problem persists, check the GitHub status page or contact support.