Entrar em Contato

Programa do Curso

Preparação de Modelos de Aprendizado de Máquina para Implantação

  • Pacoteamento de modelos com Docker.
  • Exportação de modelos do TensorFlow e PyTorch.
  • Considerações sobre versionamento e armazenamento.

Serviço de Modelos no Kubernetes

  • Visão geral dos servidores de inferência.
  • Implantação do TensorFlow Serving e TorchServe.
  • Configuração de endpoints de modelo.

Técnicas de Otimização de Inferência

  • Estratégias de agrupamento (batching).
  • Gestão de solicitações concorrentes.
  • Ajuste de latência e taxa de transferência.

Autoescalabilidade de Cargas de Trabalho de ML

  • Horizontal Pod Autoscaler (HPA).
  • Vertical Pod Autoscaler (VPA).
  • Kubernetes Event-Driven Autoscaling (KEDA).

Provisionamento de GPU e Gestão de Recursos

  • Configuração de nós com GPU.
  • Visão geral do NVIDIA device plugin.
  • Requisitos e limites de recursos para cargas de trabalho de ML.

Estratégias de Lançamento e Liberação de Modelos

  • Implantações azul/verde.
  • Padrões de lançamento em canário.
  • Testes A/B para avaliação de modelos.

Monitoramento e Observabilidade para ML em Produção

  • Métricas para cargas de trabalho de inferência.
  • Práticas de registro (logging) e rastreamento.
  • Painéis e notificações.

Considerações de Segurança e Confiabilidade

  • Segurança dos endpoints de modelo.
  • Políticas de rede e controle de acesso.
  • Garantia de alta disponibilidade.

Resumo e Próximos Passos

Requisitos

  • Compreensão dos fluxos de trabalho de aplicativos containerizados.
  • Experiência com modelos de aprendizado de máquina baseados em Python.
  • Familiaridade com os fundamentos do Kubernetes.

Público-Alvo

  • Engenheiros de ML.
  • Engenheiros de DevOps.
  • Equipes de engenharia de plataforma.
 14 Horas

Número de participantes


Preço por participante

Testemunhos de Clientes (3)

Próximas Formações Provisórias

Categorias Relacionadas