Skip to content

Latest commit

 

History

History

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
 
 
 
 
 
 
 
 
 
 

README.md

🐍 Python aplicado a Data Engineering

Esta carpeta cubre Python desde la perspectiva de un Data Engineer: manejo de datos, archivos, y construcción de pipelines.


📖 Contenido

📘 Documentos disponibles

  • Fundamentos

    • Sintaxis esencial para Data Engineering
    • Estructuras de datos (listas, diccionarios, DataFrames)
    • Control de flujo y funciones
    • Manejo de archivos (CSV, JSON, Parquet, APIs, DB)
    • Scripts vs módulos
    • Librerías clave (pandas, requests, sqlalchemy)
  • Pandas

    • Introducción a Pandas
    • Operaciones con DataFrames
    • Limpieza de datos
    • Exploración de datos (EDA)
    • Agregaciones y agrupaciones
    • Merge y Join
    • Jupyter Notebooks para análisis
  • Storytelling con Datos

    • Comunicar insights efectivamente a personas de negocios
    • Visualizaciones efectivas
    • Estructura narrativa
    • Principios de diseño
    • Lenguaje de negocio vs técnico
  • Ejemplos

    • Pipeline ETL simple
    • Limpieza de datos
    • Conexión a base de datos
    • Procesar archivos grandes

🎯 Objetivo de esta sección

Al finalizar esta sección, deberías poder:

  • Escribir código Python claro y mantenible
  • Manipular datos eficientemente con pandas
  • Realizar análisis exploratorio de datos (EDA)
  • Leer y escribir diferentes formatos de archivos
  • Estructurar proyectos Python de forma profesional
  • Usar Jupyter Notebooks para análisis interactivos
  • Conectar Python con bases de datos SQL
  • Comunicar insights de datos de forma efectiva (storytelling)

📚 Flujo de aprendizaje recomendado

  1. Instala Jupyter Notebook - Sigue las instrucciones en Fundamentos para instalar y configurar Jupyter
  2. Empieza con Fundamentos - Sintaxis y conceptos básicos (trabajando en notebooks)
    • Fundamentos Python
    • Manejo de archivos (CSV, Parquet, JSON)
    • Scripts vs Módulos
    • Storytelling con Datos (comunicar a personas de negocios)
  3. Aprende Pandas - Manipulación y exploración de datos (en notebooks)
    • Introducción a Pandas
    • Operaciones con DataFrames
    • Limpieza de datos
    • Agregaciones y agrupaciones
    • Merge y Join
  4. Revisa Ejemplos - Notebooks prácticos para referencia

🚀 ¿Qué sigue?

Según el roadmap, después de dominar Python:

👉 Siguiente etapa: 04_modelado_y_calidad (Etapa 3 del roadmap)

  • Diseño de modelos analíticos (Star Schema, etc.)
  • Calidad de datos y validaciones
  • Testing de datos

Después: 05_pipelines (Etapa 4) para construir pipelines completos y orquestados.

💡 Tip: Revisa el Roadmap completo para ver la ruta completa.


💡 Tip

No necesitas ser experto en Python, pero sí debes ser competente en las operaciones comunes de Data Engineering. Enfócate en lo práctico.