Programa do Curso

Introdução ao Aprendizado por Reforço

  • Visão geral do aprendizado por reforço e suas aplicações
  • Diferenças entre aprendizado supervisionado, não supervisionado e por reforço
  • Conceitos-chave: agente, ambiente, recompensas e política

Processos de Decisão de Markov (MDPs)

  • Compreendendo estados, ações, recompensas e transições de estado
  • Funções de valor e equação de Bellman
  • Programação dinâmica para resolver MDPs

Algoritmos Principais do RL

  • Métodos tabulares: Q-Learning e SARSA
  • Métodos baseados em política: algoritmo REINFORCE
  • Quadros de ator-crítico e suas aplicações

Aprendizado Profundo por Reforço

  • Introdução às Redes Q-Profundas (DQN)
  • Replay de experiência e redes-alvo
  • Gradientes de política e métodos avançados de RL profundo

Estruturas e Ferramentas do RL

  • Introdução ao OpenAI Gym e outros ambientes de RL
  • Usando PyTorch ou TensorFlow para desenvolvimento de modelos de RL
  • Treinamento, teste e benchmarking de agentes de RL

Desafios no RL

  • Balanço entre exploração e exploração durante o treinamento
  • Lidando com recompensas esparsas e problemas de atribuição de crédito
  • Desafios de escalabilidade e computacionais no RL

Atividades Práticas

  • Implementação dos algoritmos Q-Learning e SARSA do zero
  • Treinamento de um agente baseado em DQN para jogar um jogo simples no OpenAI Gym
  • Ajuste fino de modelos RL para desempenho melhorado em ambientes personalizados

Resumo e Próximos Passos

Requisitos

  • Compreensão sólida dos princípios e algoritmos de aprendizado de máquina
  • Proficiência em programação Python
  • Familiaridade com redes neurais e frameworks de deep learning

Público-Alvo

  • Engenheiros de aprendizado de máquina
  • Especialistas em IA
 14 Horas

Número de participantes


Preço por Participante

Declaração de Clientes (1)

Próximas Formações Provisórias

Categorias Relacionadas