Programa do Curso

Técnicas Avançadas Reinforcement Learning

Implementação de Modelos Reinforcement Learning

Exploração e Explotação

Introdução ao Reinforcement Learning

Métodos Baseados em Políticas

Q-Learning e Redes Q Profundas (DQNs)

Resumo e Próximos Passos

Trabalhando com OpenAI Gym

  • Equilibrar exploração e explotação em modelos RL
  • Estratégias de exploração: epsilon-greedy, softmax, entre outras
  • Introdução ao Q-learning
  • Implementando DQNs usando TensorFlow
  • Otimizando o Q-learning com replay de experiência e redes-alvo
  • Aprendizado por Reforço Multi-agente
  • Gradiente Político Determinístico Profundo (DDPG)
  • Otimização de Política Proximal (PPO)
  • Algoritmos de Gradiente Político
  • Algoritmo REINFORCE e sua implementação
  • Métodos ator-crítico
  • Aplicações do aprendizado por reforço no mundo real
  • Integrando modelos RL em ambientes de produção
  • Configurando ambientes no OpenAI Gym
  • Simulando agentes em ambientes dinâmicos
  • Avaliando o desempenho do agente
  • O que é aprendizado por reforço?
  • Conceitos-chave: agente, ambiente, estados, ações e recompensas
  • Desafios no aprendizado por reforço

Requisitos

Público-alvo

  • Cientistas de dados
  • Praticantes de aprendizado de máquina
  • Pesquisadores em inteligência artificial
  • Experiência com programação Python
  • Compreensão básica de conceitos de aprendizado profundo e aprendizado de máquina
  • Conhecimento de algoritmos e conceitos matemáticos utilizados no aprendizado por reforço
 28 Horas

Número de participantes


Preço por Participante

Próximas Formações Provisórias

Categorias Relacionadas