Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Programa del Curso
Introducción
Conceptos básicos de aprendizaje de refuerzo
Técnicas básicas de aprendizaje de refuerzo
Introducción a BURLAP
Convergencia de valor e iteración de política
Reward Shaping
Exploración
Generalización
Parcialmente MDP observables
Opciones
logística
TD Lambda
Gradientes de política
Deep Q-Learning
Temas en la teoría de juegos
Resumen y Conclusión
Requerimientos
- Competencia en Python
- Una comprensión de cálculo universitario y álgebra lineal
- Comprensión básica de probabilidad y estadística
- Python y Numpy
21 horas