PyCon Chile 2021
Here is the recording of the workshop.
Here is the link to the repo with the set up instructions for the workshop.
Here is the proposal I submitted for the workshop.
Titulo
“ETL Pipelines 4 Data Professionals”
Date: 5 November 2021 from 2 to 6pm CDT
PyCon Chile 2021
Bienvenidos a ETL Pipelines 4 Data Professionals, un tutorial de programacion en el cual aprenderas a crear tuberias para manejar el procesamiento para extraer, transformar, y descargar datos a una nueva base de datos.
Este tutorial se llevara acabo a traves de Binder y lo pueded acceder usando el boton en la siguiente linea.
Si quieres, puedes seguir el tutorial desde tu computadora, solo asegurate de tener JupyterLab, pandas, y Prefect instalado.
Organización del Tutorial
The time budgeted for this tutorial is about 3.5 hours including breaks. We will follow, as best as possible, the following schedule.
-
**Introduccion 18:30 - 18:40 Chile Continental (GMT-3)** - desglose del tutorial
- Introduccion del Instructor
- Abre nuestro entorno computacional
-
**Explicacion de ETL 18:40 - 18:50 Chile Continental (GMT-3)** - In this section, we will cover some of the basic building blocks for working with dask dataframes.
- Introduccion al Caso a resolver
-
**1era Parte - ETL con 🐼’s pipe
18:50 - 19:25 Chile Continental (GMT-3)** - 5 minutos de receso
-
**2da Parte - ETL con Prefect 19:30 - 20:30 Chile Continental (GMT-3)**
Prerequisitos
El público objetivo de esta sesión incluye analistas de todos los niveles, programadores, científicos de datos e ingenieros que desean aprender a crear sus propias tuberias de datos.
El tutorial es al nivel intermedio y los siguientes son algunos de sus requisitos necesarios para el taller.
- Un año usando Python.
- Los participantes deben sentirse cómodos con loops, funciones, listas de comprensión y declaraciones if-else.
- No es necesario tener conocimiento de pandas, NumPy, sqlite3, o prefect, pero un poco de experiencia con (o alguna exposición a) estos modulos sería muy beneficioso durante el tutorial.
- Si bien no se requiere tener experiencia con un entorno de desarrollo integrado como Jupyter Lab, esto sería muy beneficioso para la sesión, ya que es la herramienta que usaremos en todo momento.