Esta sección cubre los fundamentos de Python necesarios para Data Engineering. Trabajaremos con Jupyter Notebooks para aprender de forma interactiva.
Si usas Cursor, es muy simple:
-
Abre el notebook de ejemplo:
- Ve a
03_python/ejemplos/00-notebook.ipynb - Ábrelo en Cursor (haz doble clic o click derecho → "Open with Cursor")
- Ve a
-
Selecciona el kernel de Python:
- En la parte superior del notebook, verás un selector de kernel
- Haz clic y selecciona tu entorno Python (el que configuraste con
pyenvo tu Python global) - Si no aparece, Cursor te pedirá instalar la extensión de Jupyter (acepta)
-
¡Empieza a escribir código!:
- El notebook está vacío para que agregues tus propias celdas
- Presiona
Shift + Enterpara ejecutar una celda - Agrega nuevas celdas con el botón
+oCmd/Ctrl + B
💡 Tip: Cursor tiene soporte nativo para Jupyter Notebooks. No necesitas instalar nada adicional, solo abrir el archivo
.ipynby seleccionar el kernel.
Si prefieres usar Jupyter Notebook tradicional, sigue estos pasos:
Asegúrate de tener Python instalado:
python3 --version
# Debería mostrar Python 3.8 o superior💡 Si usas
pyenv: Asegúrate de tener un entorno virtual activado. Revisa SETUP.md para más detalles.
# Instalar Jupyter y librerías básicas
pip install jupyter pandas matplotlib seaborn
# O si usas pyenv-virtualenv:
# pyenv virtualenv 3.11.0 python-fundamentos
# pyenv activate python-fundamentos
# pip install jupyter pandas matplotlib seaborn# Desde la carpeta donde quieres trabajar
jupyter notebook
# O usar JupyterLab (interfaz más moderna)
jupyter labSe abrirá en tu navegador en http://localhost:8888
- En la interfaz de Jupyter, navega a
03_python/ejemplos/ - Abre el archivo
00-notebook.ipynb(está vacío para que empieces desde cero) - O crea un nuevo notebook: haz clic en "New" → "Python 3"
- Escribe tu primer código:
print("¡Hola, Data Engineering!")
- Presiona Shift + Enter para ejecutar la celda
💡 Tip: El notebook
00-notebook.ipynbestá vacío intencionalmente. Úsalo como punto de partida para tus ejercicios.
-
- Sintaxis esencial
- Estructuras de datos
- Control de flujo
- Funciones
- Librerías clave
-
- Leer/escribir CSV, JSON, Parquet, Excel
- Trabajar con APIs
- Conexión a bases de datos
- Procesar archivos grandes
-
- Cuándo usar scripts simples
- Cuándo modularizar código
- Estructura de proyectos
- Reutilización de código
💡 Nota: Por ahora trabajaremos principalmente con Jupyter Notebooks. Los scripts Python los veremos más adelante cuando construyamos pipelines. Sin embargo, entender estos conceptos te ayudará a organizar mejor tu código.
-
- Comunicar hallazgos a personas de negocios
- Principios de visualización efectiva
- Estructura de historias con datos
- Lenguaje de negocio vs técnico
💡 Importante: En Data Engineering no solo construyes pipelines, también necesitas comunicar resultados a ejecutivos y stakeholders. El storytelling es tu puente entre datos técnicos y decisiones de negocio.
Al finalizar esta sección, deberías poder:
- Trabajar con Jupyter Notebooks para escribir y ejecutar código Python
- Escribir código Python claro y mantenible en notebooks
- Leer y escribir diferentes formatos de archivos (CSV, JSON, Parquet, Excel)
- Procesar archivos grandes usando técnicas de chunking
- Organizar código en scripts y módulos cuando sea apropiado
- Comunicar hallazgos efectivamente a personas de negocios usando storytelling con datos
Ahora que sabes los fundamentos de Python, continúa con:
- Pandas - Manipulación y análisis de datos con pandas
- Jupyter Notebooks para Datos - Exploración de datos (EDA) y análisis interactivo
Flujo completo de Fundamentos:
- Fundamentos Python → 2. Manejo de archivos → 3. Scripts vs Módulos → 4. Storytelling con Datos
Recuerda: Los fundamentos sólidos te permitirán escribir código Python efectivo en Data Engineering.