Entrar em Contato

Programa do Curso

Introdução ao Mistral em Escala

  • Visão geral do Mistral Medium 3
  • Trade-offs entre performance e custo
  • Considerações em escala empresarial

Padrões de Implantação para LLMs

  • Topologias de serving e escolhas de design
  • Implantações on-premises vs. na nuvem
  • Estratégias híbridas e multi-cloud

Técnicas de Otimização de Inferência

  • Estratégias de batch processing para alta produtividade
  • Métodos de quantização para redução de custos
  • Utilização de aceleradores e GPUs

Escalabilidade e Confiabilidade

  • Escalonamento de clusters Kubernetes para inferência
  • Balanceamento de carga e roteamento de tráfego
  • Tolerância a falhas e redundância

Ferramentas de Engenharia de Custo

  • Medição da eficiência de custo de inferência
  • Ajuste correto (right-sizing) de recursos de computação e memória
  • Monitoramento e alertas para otimização

Segurança e Conformidade em Produção

  • Segurança de implantações e APIs
  • Considerações de governança de dados
  • Conformidade regulatória na engenharia de custos

Estudos de Caso e Melhores Práticas

  • Arquiteturas de referência para Mistral em escala
  • Lições aprendidas em implantações empresariais
  • Tendências futuras na inferência eficiente de LLMs

Resumo e Próximos Passos

Requisitos

  • Conhecimento sólido de implantação de modelos de machine learning
  • Experiência com infraestrutura de nuvem e sistemas distribuídos
  • Familiaridade com estratégias de tuning de performance e otimização de custos

Público-Alvo

  • Engenheiros de infraestrutura
  • Arquitetos de nuvem
  • Líderes de MLOps
 14 Horas

Número de participantes


Preço por participante

Próximas Formações Provisórias

Categorias Relacionadas