Programa do Curso

Fundamentos dos Sistemas Agênticos em Produção

  • Arquiteturas agênticas: loops, ferramentas, memória e camadas de orquestração
  • Ciclo de vida dos agentes: desenvolvimento, implantação e operação contínua
  • Desafios da gestão de agentes em escala de produção

Infraestrutura e Modelos de Implantação

  • Implantação de agentes em ambientes containerizados e na nuvem
  • Padrões de escalabilidade: escala horizontal vs vertical, concorrência e limitação
  • Orquestração multi-agente e balanceamento de carga

Monitoramento e Observabilidade

  • Métricas-chave: latência, taxa de sucesso, uso de memória e profundidade das chamadas dos agentes
  • Rastreamento da atividade do agente e gráficos de chamadas
  • Instrumentação de observabilidade usando Prometheus, OpenTelemetry e Grafana

Logging, Auditoria e Conformidade

  • Logging centralizado e coleta estruturada de eventos
  • Conformidade e auditabilidade em fluxos de trabalho agênticos
  • Design de trilhas de auditoria e mecanismos de replay para depuração

Otimização de Desempenho e Recursos

  • Redução da sobrecarga de inferência e otimização dos ciclos de orquestração de agentes
  • Cache de modelos e embeddings leves para recuperação mais rápida
  • Teste de carga e cenários de estresse para pipelines AI

Controle de Custos e Governança

  • Compreensão dos fatores que impulsionam os custos dos agentes: chamadas API, memória, computação e integrações externas
  • Rastreamento de custos ao nível do agente e implementação de modelos de cobrança
  • Políticas de automação para prevenir o crescimento descontrolado dos agentes e consumo de recursos ociosos

Estratégias de CI/CD e Implantação para Agentes

  • Integração de pipelines de agentes em sistemas CI/CD
  • Teste, versionamento e estratégias de reversão para atualizações iterativas dos agentes
  • Rollouts progressivos e mecanismos de implantação seguros

Recuperação de Falhas e Engenharia de Confiabilidade

  • Projeto para tolerância a falhas e degradação gracefull
  • Padrões de retry, timeout e circuit breaker para confiabilidade dos agentes
  • Frameworks de resposta a incidentes e pós-mortem para operações AI

Projeto Final

  • Construir e implantar um sistema AI agêntico com monitoramento completo e rastreamento de custos
  • Simular carga, medir desempenho e otimizar o uso de recursos
  • Apresentar a arquitetura final e painel de monitoramento aos colegas

Resumo e Próximos Passos

Requisitos

  • Compreensão sólida de MLOps e sistemas de machine learning em produção
  • Experiência com implantações containerizadas (Docker/Kubernetes)
  • Familiaridade com otimização de custos na nuvem e ferramentas de observabilidade

Público-alvo

  • Engenheiros MLOps
  • Engenheiros de Confiabilidade do Site (SREs)
  • Gerentes de engenharia que supervisionam a infraestrutura AI
 21 Horas

Número de participantes


Preço por Participante

Declaração de Clientes (3)

Próximas Formações Provisórias

Categorias Relacionadas