Programa del Curso

Introducción

  • Aprendizaje a través del refuerzo positivo

Elementos de Reinforcement Learning

Términos importantes (Acciones, Estados, Recompensas, Política, Valor, Valor Q, etc.)

Descripción general de los métodos de soluciones tabulares

Creación de un agente software

Comprensión de los enfoques basados en valores, políticas y modelos

Trabajar con el Proceso de Decisión de Markov (MDP)

Cómo definen las políticas la forma de comportarse de un agente

Uso de métodos de Monte Carlo

Aprendizaje de Diferencias Temporales

n-paso Bootstrapping

Métodos de solución aproximados

Predicción en política con aproximación

Control en la política con aproximación

Métodos fuera de política con aproximación

Descripción de los seguimientos de elegibilidad

Uso de métodos de gradiente de políticas

Resumen y conclusión

Requerimientos

  • Experiencia con el aprendizaje automático
  • Programming Experiencia

Audiencia

  • Científicos de datos
 21 horas

Número de participantes



Precio por participante

Testimonios (2)

Cursos Relacionados

Aprendizaje de refuerzo profundo con Python

21 horas

Large Language Models (LLMs) and Reinforcement Learning (RL)

21 horas

Reinforcement Learning with Java

21 horas

AI-102T00: Designing and Implementing a Microsoft Azure AI Solution

28 horas

AI-Augmented Software Engineering (AIASE)

14 horas

AI Coding Assistants: Enhancing Developer Productivity

7 horas

Introduction to Data Science and AI using Python

35 horas

AI in Digital Marketing

7 horas

Inteligencia Artificial (IA) para Directivos

7 horas

Artificial Intelligence (AI) for Robotics

21 horas

Introduction to Artificial Intelligence (AI)

35 horas

AI and Robotics for Nuclear - Extended

120 horas

AI and Robotics for Nuclear

80 horas

AI en los negocios y la sociedad y el futuro de la IA - AI / Robótica

7 horas

Introduction to AI Trust, Risk, and Security Management (AI TRiSM)

21 horas

Categorías Relacionadas