Entrar em Contato

Programa do Curso

Preparação de Modelos de Aprendizado de Máquina para Implantação

  • Empacotamento de modelos com Docker
  • Exportação de modelos do TensorFlow e PyTorch
  • Considerações sobre versionamento e armazenamento

Serviço de Modelos no Kubernetes

\r
  • Visão geral dos servidores de inferência
  • Implantação do TensorFlow Serving e TorchServe
  • Configuração de endpoints de modelos

Técnicas de Otimização de Inferência

  • Estratégias de lote (batching)
  • Gerenciamento de requisições concurrentes
  • Ajuste de latência e vazão (throughput)

Dimensionamento Automático de Cargas de Trabalho de ML

  • Horizontal Pod Autoscaler (HPA)
  • Vertical Pod Autoscaler (VPA)
  • Kubernetes Event-Driven Autoscaling (KEDA)

Provisionamento de GPU e Gerenciamento de Recursos

  • Configuração de nós com GPU
  • Visão geral do NVIDIA device plugin
  • Solicitações e limites de recursos para cargas de trabalho de ML

Estratégias de Implantação e Lançamento de Modelos

  • Implantações Blue/green
  • Padrões de lançamento tipo canário
  • Testes A/B para avaliação de modelos

Monitoramento e Observabilidade para ML em Produção

  • Métricas para cargas de trabalho de inferência
  • Práticas de registro (logging) e rastreamento (tracing)
  • Painéis (dashboards) e alertas

Considerações de Segurança e Confiabilidade

  • Segurança de endpoints de modelos
  • Políticas de rede e controle de acesso
  • Garantia de alta disponibilidade

Resumo e Próximos Passos

Requisitos

  • Conhecimento sobre fluxos de trabalho de aplicações containerizadas
  • Experiência com modelos de aprendizado de máquina baseados em Python
  • Familiaridade com os fundamentos do Kubernetes

Público-Alvo

  • Engenheiros de ML
  • Engenheiros de DevOps
  • Equipes de engenharia de plataforma
 14 Horas

Número de participantes


Preço por participante

Testemunhos de Clientes (3)

Próximas Formações Provisórias

Categorias Relacionadas