Skip to content

Latest commit

 

History

History
55 lines (34 loc) · 2.06 KB

File metadata and controls

55 lines (34 loc) · 2.06 KB

License

Aprendizaje por refuerzo

Temario sobre aprendizaje por refuerzo (reinforcement learning) en español.

Elaborado por Antonio Manjavacas (manjavacas@ugr.es).

📃 Contenidos

  1. Introducción
  2. Bandits
  3. Procesos de decisión de Markov
  1. Programación dinámica
  2. Métodos basados en muestreo
    4.1. Monte Carlo
    4.2. TD-learning
  3. Planificación
  4. Resumen
  1. Aproximación de funciones de valor
  2. Aproximación de políticas

📝 TO-DO

📁 Material

📚 Bibliografía

Principales fuentes empleadas en la elaboración de este temario:

🚀 Contribuye

Si quieres ayudar a mejorar este proyecto, envía sugerencias o colabora reportando errores a través de issues.

✍️ Uso y licencia

Este material se distribuye bajo licencia GPLv3.