Sistema de Forecasting de Demanda de Envíos

Sistema end-to-end de forecasting de demanda de envíos para e-commerce LATAM, orientado a la planificación de capacidad operacional.

Problema

Las plataformas de e-commerce en LATAM operan redes logísticas continentales. La planificación de capacidad operacional (personal de bodega, flota, espacio en centros de distribución) depende críticamente de predecir cuántos paquetes se procesarán por región y por día.

Sub-predecir → colapso operacional, atrasos, mala experiencia del cliente
Sobre-predecir → costo operacional innecesario (personal ocioso, flota subutilizada)

Objetivo

Dado el registro histórico de envíos por región, predecir el volumen diario de paquetes por estado con un horizonte de 7 a 90 días, con suficiente precisión para informar decisiones de capacidad. El sistema va más allá de la precisión promedio: contempla explícitamente el costo asimétrico de sub-predecir vs sobre-predecir.

Aspectos destacados

311 tests passing, CI verde, codebase modular OOP distribuido en 39 archivos fuente.
Evaluación cost-sensitive: se detectó que la precisión promedio (WAPE) es engañosa bajo costos asimétricos. Se construyó un pipeline completo de análisis costo-vs-tuning que cuantifica la ganancia en dólares a lo largo de distintos ratios de costo (1x a 5x).
Auditoría de rigor estadístico: se identificó un leakage sutil de eval_set en el WAPE de holdout reportado en Fase 6 (0.4694). Se re-evaluó honestamente sin ese atajo (0.5156) y la trazabilidad quedó documentada explícitamente en el metadata sidecar del modelo.
Forecasting recursivo: el modelo LightGBM maneja correctamente las features de lag en horizontes largos inyectando las predicciones de vuelta en el DataFrame de trabajo, evitando el clásico bug de colapso al promedio.

Stack técnico

Lenguaje: Python 3.11
Gestor de dependencias: uv
Datos: pandas, SQLAlchemy, pyarrow
ML: scikit-learn, LightGBM, statsmodels, Prophet
Tuning de hiperparámetros: Optuna (TPE + MedianPruner)
Interpretabilidad: SHAP
Tracking de experimentos: MLflow
API: FastAPI (schemas Pydantic v2, carga del modelo gestionada por lifespan)
Dashboard: Streamlit (desplegado en Streamlit Cloud)
Infraestructura: Docker, GitHub Actions
Calidad: pytest, ruff, mypy, pre-commit

Estructura del proyecto

meli-shipping-forecast/ ├── src/shipping_forecast/ │ ├── api/ # Servicio FastAPI (Fase 8) │ │ └── v1/ # Endpoints versionados + schemas Pydantic │ ├── config/ # Configuración (Pydantic Settings) │ ├── data/ # Ingesta de datos, queries y loader SQLite │ ├── evaluation/ # Métricas, cross-validation, cost-sensitive │ ├── features/ # Feature engineering OOP (lags, calendar, eventos) │ ├── models/ # SeasonalNaive, LightGBM, Conformal, Prophet │ ├── pipelines/ # Entrenamiento final con holdout honesto │ └── utils/ # Logging y helpers ├── tests/ # 311 tests unitarios + integración ├── notebooks/ # EDA + tuning + análisis cost-sensitive ├── sql/ # Scripts DDL y queries analíticas ├── scripts/ # Tuning con Optuna, carga inicial, análisis batch └── .github/workflows/ # CI/CD

Setup

Prerequisitos

Python 3.11
uv (gestor moderno de dependencias)
Usuarios de macOS: brew install libomp (requerido por LightGBM)

Instalación

git clone https://github.com/JulioPradenas/meli-shipping-forecast.git
cd meli-shipping-forecast
uv venv --python 3.11
source .venv/bin/activate
uv sync --all-extras

Comandos comunes

make test          # Correr tests con coverage
make lint          # Ruff linter (sin auto-fix)
make typecheck     # Mypy
make check         # Todas las quality checks (lint + typecheck + test)
make fix           # Auto-formatear código + correr todas las checks
make train-model   # Entrenar y persistir el modelo LightGBM final

Estado del proyecto

Fases completadas

Fase 1: Setup del proyecto, tooling, CI/CD
Fase 2: Ingesta de datos del dataset Olist a SQLite, SQL avanzado (window functions para lags/rolling stats)
Fase 3: EDA temporal (estacionalidad, eventos, anomalías por estado)
Fase 4: Feature engineering en OOP (LagFeatures, CalendarFeatures, EventFeatures, etc., pipeline composable)
Fase 5: Modelos baseline (Naive, SeasonalNaive con WAPE=0.4355 promedio en CV folds 1-3)
Fase 6: Modelo LightGBM tuneado con Optuna (100 trials, 8 hiperparámetros, MedianPruner). WAPE CV mean = 0.4042
Fase 7: Evaluación cost-sensitive. Pipeline batch que computa ganancia esperada bajo costos asimétricos para 4 cost ratios y 4 folds. Notebook con análisis y 3 plots
Fase 8: API productiva con FastAPI (completa)

Fase 8 — Completada

Fase 9 — Completada

Fase 9: Dashboard Streamlit + deploy en Streamlit Cloud → Ver dashboard

Métricas clave del modelo actual

Modelo en producción: LightGBM tuneado con Optuna, 23 features, 27 estados brasileños.

Métrica	Valor	Notas
WAPE (holdout 2018-07 a 2018-08, 62 días)	0.5156	Strict, sin leakage de `eval_set`
MAE (mismo holdout)	4.04	Mean Absolute Error en unidades de paquetes/día
RMSE (mismo holdout)	14.22	Root Mean Squared Error
CV WAPE (folds 1-3)	0.4042	Usado por Optuna durante tuning
Best Optuna trial	#36 de 100	TPE sampler con MedianPruner

El modelo se persiste con metadata trazable: timestamp UTC de entrenamiento, fechas del holdout, métricas honestas, y nota explicando la metodología sin atajos estadísticos.

API Service

El proyecto expone un servicio HTTP (FastAPI) que sirve predicciones de demanda de envíos con intervalos conformales y recomendaciones cost-aware.

Quickstart

# 1. Generar el modelo (primera vez o después de cambios en el pipeline)
make train-model

# 2. Levantar el servidor
uv run uvicorn shipping_forecast.api.app:app --port 8000 --reload

# 3. Verificar que está corriendo
curl http://127.0.0.1:8000/v1/health

Endpoints

Endpoint	Método	Descripción
`/v1/health`	GET	Liveness + readiness. Retorna 200 con versión del modelo, 503 si no está cargado
`/v1/model/info`	GET	Metadata pública del modelo: versión, fechas, estados, métricas de evaluación
`/v1/predict`	POST	Predicciones de demanda para un rango de fechas y estados opcionales

POST `/v1/predict` — Parámetros

Parámetro	Tipo	Requerido	Default	Descripción
`start_date`	date	✅	—	Primer día a predecir (debe ser > `last_train_date`)
`end_date`	date	✅	—	Último día (máximo 90 días desde `start_date`)
`states`	list[str]	❌	todos	Subconjunto de los 27 estados brasileños
`include_intervals`	bool	❌	`true`	Incluir `lower_90` / `upper_90` en el response
`include_cost_aware`	bool	❌	`true`	Incluir `recommended`, `alpha_used`, `cost_ratio_used`
`alpha`	float	❌	0.65	Parámetro de asimetría. Rango: [-2, +2]
`cost_ratio`	float	❌	3.0	Ratio costo-subpredicción vs sobrepredicción. Rango: [0.5, 10]

El parámetro `alpha` — cost-aware predictions

El modelo genera predicciones puntuales (point) e intervalos conformales calibrados al 90% (lower_90, upper_90). El campo recommended aplica un margen asimétrico para reflejar el costo diferencial de errar en cada dirección: alpha > 0 → recommended = point + alpha × (upper_90 - point) # penaliza subpredicción alpha = 0 → recommended = point # sin ajuste alpha < 0 → recommended = point + alpha × (point - lower_90) # penaliza sobrepredicción

Con alpha = 0.65 (default), el recommended se ubica 65% del camino entre point y upper_90, balanceando la cobertura operacional contra el costo de sobre-provisionar capacidad.

Ejemplo de request / response

curl -X POST http://127.0.0.1:8000/v1/predict \
  -H "Content-Type: application/json" \
  -d '{
    "start_date": "2018-09-01",
    "end_date": "2018-09-03",
    "states": ["SP"],
    "alpha": 0.65
  }'

{
  "model_version": "lgbm-v1.1.0",
  "predictions": [
    {
      "date": "2018-09-01",
      "state": "SP",
      "point": 1.67,
      "lower_90": 0.0,
      "upper_90": 17.99,
      "recommended": 12.28,
      "alpha_used": 0.65,
      "cost_ratio_used": 3.0
    }
  ],
  "metadata": {
    "predicted_at": "2026-05-20T17:00:00Z",
    "n_predictions": 3,
    "alpha_source": "request",
    "cost_ratio_source": "server_default"
  }
}

Trazabilidad y observabilidad

Cada request recibe un X-Request-ID (generado o propagado desde el caller) que aparece en todos los logs y se devuelve en el response header.
Logs en JSON (producción) o consola con colores (desarrollo), con campos estructurados: n_predictions, horizon_days, alpha_used, alpha_source, model_version.
El campo alpha_source ("request" vs "server_default") permite auditar qué parámetros usó cada predicción.

Stack técnico del servicio

Componente	Tecnología
Framework HTTP	FastAPI
Validación de schemas	Pydantic v2
Servidor ASGI	Uvicorn
Logging estructurado	structlog
Tests	pytest + TestClient (mock model, sin DB en CI)
Tests E2E	pytest + modelo real (skippean en CI)

Licencia

MIT

Name		Name	Last commit message	Last commit date
Latest commit History 61 Commits
.github/workflows		.github/workflows
.vscode		.vscode
artifacts		artifacts
data		data
models/saved		models/saved
notebooks		notebooks
reports/figures		reports/figures
scripts		scripts
sql		sql
src/shipping_forecast		src/shipping_forecast
tests		tests
.gitignore		.gitignore
.pre-commit-config.yaml		.pre-commit-config.yaml
.python-version		.python-version
Makefile		Makefile
README.md		README.md
pyproject.toml		pyproject.toml
requirements.txt		requirements.txt
streamlit_app.py		streamlit_app.py
uv.lock		uv.lock

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Sistema de Forecasting de Demanda de Envíos

Problema

Objetivo

Aspectos destacados

Stack técnico

Estructura del proyecto

Setup

Prerequisitos

Instalación

Comandos comunes

Estado del proyecto

Fases completadas

Fase 8 — Completada

Fase 9 — Completada

Métricas clave del modelo actual

API Service

Quickstart

Endpoints

POST `/v1/predict` — Parámetros

El parámetro `alpha` — cost-aware predictions

Ejemplo de request / response

Trazabilidad y observabilidad

Stack técnico del servicio

Licencia

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Sistema de Forecasting de Demanda de Envíos

Problema

Objetivo

Aspectos destacados

Stack técnico

Estructura del proyecto

Setup

Prerequisitos

Instalación

Comandos comunes

Estado del proyecto

Fases completadas

Fase 8 — Completada

Fase 9 — Completada

Métricas clave del modelo actual

API Service

Quickstart

Endpoints

POST /v1/predict — Parámetros

El parámetro alpha — cost-aware predictions

Ejemplo de request / response

Trazabilidad y observabilidad

Stack técnico del servicio

Licencia

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

POST `/v1/predict` — Parámetros

El parámetro `alpha` — cost-aware predictions

Packages