Esta carpeta cubre cómo construir, orquestar y monitorear pipelines de datos en producción.
-
- Conceptos fundamentales de pipelines
- Componentes básicos
- Pipelines con Python puro
- Estructura de proyectos
- Testing de pipelines
-
- Comparación de orquestadores
- Orquestadores locales (para desarrollo):
- Prefect (moderno, Python-first)
- Dagster (data assets, UI excelente)
- Orquestadores enterprise/cloud:
- Airflow (estándar industria, completo)
- Luigi (simple, Python puro)
- AWS Step Functions (serverless)
- Google Cloud Composer (Airflow gestionado)
- Azure Data Factory (Azure nativo)
Al finalizar esta sección, deberías poder:
- Diseñar y construir pipelines ETL/ELT básicos
- Construir pipelines con Python puro (sin orquestadores)
- Elegir el orquestador apropiado para tu caso
- Orquestar pipelines con herramientas modernas
- Manejar errores y dependencias
- Monitorear y mantener pipelines en producción
- Empieza con Pipelines básicos - Aprende conceptos y construye pipelines con Python puro
- Explora Orquestadores - Empieza con orquestadores locales (Prefect, Dagster) para desarrollo, luego escala a enterprise (Airflow) cuando necesites producción
💡 Tip: Revisa el Roadmap completo para ver la ruta completa.
Un pipeline no es solo código. Piensa en orquestación, monitoreo, manejo de errores y mantenibilidad desde el diseño.