Esta carpeta cubre Python desde la perspectiva de un Data Engineer: manejo de datos, archivos, y construcción de pipelines.
-
- Sintaxis esencial para Data Engineering
- Estructuras de datos (listas, diccionarios, DataFrames)
- Control de flujo y funciones
- Manejo de archivos (CSV, JSON, Parquet, APIs, DB)
- Scripts vs módulos
- Librerías clave (pandas, requests, sqlalchemy)
-
✅ Pandas
- Introducción a Pandas
- Operaciones con DataFrames
- Limpieza de datos
- Exploración de datos (EDA)
- Agregaciones y agrupaciones
- Merge y Join
- Jupyter Notebooks para análisis
-
- Comunicar insights efectivamente a personas de negocios
- Visualizaciones efectivas
- Estructura narrativa
- Principios de diseño
- Lenguaje de negocio vs técnico
-
✅ Ejemplos
- Pipeline ETL simple
- Limpieza de datos
- Conexión a base de datos
- Procesar archivos grandes
Al finalizar esta sección, deberías poder:
- Escribir código Python claro y mantenible
- Manipular datos eficientemente con pandas
- Realizar análisis exploratorio de datos (EDA)
- Leer y escribir diferentes formatos de archivos
- Estructurar proyectos Python de forma profesional
- Usar Jupyter Notebooks para análisis interactivos
- Conectar Python con bases de datos SQL
- Comunicar insights de datos de forma efectiva (storytelling)
- Instala Jupyter Notebook - Sigue las instrucciones en Fundamentos para instalar y configurar Jupyter
- Empieza con Fundamentos - Sintaxis y conceptos básicos (trabajando en notebooks)
- Fundamentos Python
- Manejo de archivos (CSV, Parquet, JSON)
- Scripts vs Módulos
- Storytelling con Datos (comunicar a personas de negocios)
- Aprende Pandas - Manipulación y exploración de datos (en notebooks)
- Introducción a Pandas
- Operaciones con DataFrames
- Limpieza de datos
- Agregaciones y agrupaciones
- Merge y Join
- Revisa Ejemplos - Notebooks prácticos para referencia
Según el roadmap, después de dominar Python:
👉 Siguiente etapa: 04_modelado_y_calidad (Etapa 3 del roadmap)
- Diseño de modelos analíticos (Star Schema, etc.)
- Calidad de datos y validaciones
- Testing de datos
Después: 05_pipelines (Etapa 4) para construir pipelines completos y orquestados.
💡 Tip: Revisa el Roadmap completo para ver la ruta completa.
No necesitas ser experto en Python, pero sí debes ser competente en las operaciones comunes de Data Engineering. Enfócate en lo práctico.