Programa do Curso

Conceitos e Métricas de Desempenho

  • Atraso, throughput, uso de energia, utilização de recursos
  • Gargalos do sistema versus nível do modelo
  • Perfilamento para inferência versus treinamento

Perfilamento em Huawei Ascend

  • Usando CANN Profiler e MindInsight
  • Diagnósticos de núcleos e operadores
  • Padrões de descarga e mapeamento de memória

Perfilamento em Biren GPU

  • Recursos de monitoramento de desempenho do SDK Biren
  • Fusão de núcleos, alinhamento de memória e filas de execução
  • Perfilamento sensível à energia e temperatura

Perfilamento em Cambricon MLU

  • Ferramentas de desempenho BANGPy e Neuware
  • Visibilidade ao nível do núcleo e interpretação de logs
  • Integração do profiler MLU com frameworks de implantação

Otimização em Nível de Grafo e Modelo

  • Estratégias de poda de grafo e quantização
  • Fusão de operadores e reestruturação de grafos computacionais
  • Padrões de tamanho da entrada e ajuste por lote

Otimização de Memória e Núcleo

  • Otimização de layout e reaproveitamento de memória
  • Gerenciamento eficiente de buffers entre conjuntos de chips
  • Técnicas de ajuste ao nível do núcleo por plataforma

Melhores Práticas Cross-Platform

  • Portabilidade de desempenho: estratégias de abstração
  • Criação de pipelines de ajuste compartilhados para ambientes multi-chip
  • Exemplo: ajustando um modelo de detecção de objetos entre Ascend, Biren e MLU

Resumo e Próximos Passos

Requisitos

  • Experiência com pipelines de treinamento ou deploy de modelos AI
  • Compreensão dos princípios computacionais GPU/MLU e otimização de modelos
  • Familiaridade básica com ferramentas e métricas de perfil de desempenho

Público-Alvo

  • Engenheiros de desempenho
  • Equipes de infraestrutura de aprendizado de máquina
  • Arquitetos de sistemas AI
 21 Horas

Número de participantes


Preço por Participante

Próximas Formações Provisórias

Categorias Relacionadas