Volver a proyectos
📊Data Analytics

ETL Pipeline

Apache AirflowdbtSnowflakePython

Construí un pipeline ETL end-to-end que extrae datos de APIs de terceros (Salesforce, Google Analytics, Stripe), los transforma usando dbt y los carga en Snowflake. Orquestado con Apache Airflow, el pipeline ejecuta más de 50 tareas diarias con manejo de errores, reintentos y notificaciones. Implementé validaciones de calidad de datos, tests dbt y monitoreo con alertas en Slack para detectar anomalías en los datos.

Resultados clave

  • 1Orquestación de 50+ tareas diarias
  • 2Modelado dimensional con dbt
  • 3Data warehouse en Snowflake
  • 4Monitorización y alertas automatizadas
  • 5Validaciones de calidad con Great Expectations