Programa do Curso

Introdução ao Reinforcement Learning

  • O que é aprendizado por reforço?
  • Conceitos-chave: agente, ambiente, estados, ações e recompensas
  • Desafios no aprendizado por reforço

Exploração e Explotação

  • Balanceando exploração e explotação em modelos RL
  • Estratégias de exploração: epsilon-greedy, softmax e mais

Q-Learning e Redes Deep Q (DQNs)

  • Introdução ao Q-learning
  • Implementando DQNs usando TensorFlow
  • Otimizando o Q-learning com replay de experiência e redes alvo

Métodos Baseados em Políticas

  • Algoritmos de gradiente de política
  • Algoritmo REINFORCE e sua implementação
  • Métodos ator-crítico

Trabalhando com OpenAI Gym

  • Configurando ambientes no OpenAI Gym
  • Simulando agentes em ambientes dinâmicos
  • Avaliando o desempenho do agente

Técnicas Avançadas de Reinforcement Learning

  • Aprendizado por reforço multi-agente
  • Gradiente determinístico profundo (DDPG)
  • Otimização de política proximal (PPO)

Implantação de Modelos Reinforcement Learning

  • Aplicações no mundo real do aprendizado por reforço
  • Integração de modelos RL em ambientes de produção

Resumo e Próximos Passos

Requisitos

  • Experiência com Python programação
  • Compreensão básica de conceitos de aprendizado profundo e machine learning
  • Conhecimento sobre algoritmos e conceitos matemáticos usados no aprendizado por reforço

Público-alvo

  • Cientistas de dados
  • Praticantes de machine learning
  • Pesquisadores em IA
 28 Horas

Número de participantes


Preço por Participante

Próximas Formações Provisórias

Categorias Relacionadas