Programa do Curso

Introdução ao Desenvolvimento de Operadores Personalizados

  • Por que construir operadores personalizados? Casos de uso e restrições
  • Estrutura do tempo de execução CANN e pontos de integração de operadores
  • Visão geral de TBE, TIK e TVM no ecossistema AI da Huawei

Usando o TIK para Operadores de Nível Baixo Programming

  • Entendendo o modelo de programação TIK e APIs suportadas
  • Gerenciamento de memória e estratégia de tiling no TIK
  • Criando, compilando e registrando um operador personalizado com CANN

Testando e Validando Operadores Personalizados

  • Testes unitários e de integração de operadores no gráfico
  • Depuração de problemas de desempenho no nível do kernel
  • Visualizando a execução dos operadores e o comportamento do buffer

Agenda e Otimização Baseada em TVM

  • Visão geral do TVM como compilador de operações tensoriais
  • Escrevendo uma agenda para um operador personalizado no TVM
  • Ajuste, benchmarking e geração de código do TVM para Ascend

Integração com Frameworks e Modelos

  • Registrar operadores personalizados para MindSpore e ONNX
  • Verificando a integridade do modelo e o comportamento de fallback
  • Apoiando gráficos multi-operador com precisão mista

Estudos de Caso e Otimizações Especializadas

  • Estudo de caso: convolução de alta eficiência para formas de entrada pequenas
  • Estudo de caso: otimização do operador de atenção com consciência da memória
  • Melhores práticas na implantação de operadores personalizados em diferentes dispositivos

Resumo e Próximos Passos

Requisitos

  • Conhecimento profundo dos internos de modelos de IA e cálculos ao nível do operador
  • Experiência com os ambientes de desenvolvimento Python e Linux
  • Familiaridade com compiladores de redes neurais ou otimizadores de nível gráfico

Público-alvo

  • Engenheiros de compilação trabalhando em cadeias de ferramentas de IA
  • Desenvolvedores de sistemas focados na otimização de baixo nível para IA
  • Desenvolvedores construindo operações personalizadas ou direcionando cargas de trabalho inovadoras de IA
 14 Horas

Número de participantes


Preço por Participante

Próximas Formações Provisórias

Categorias Relacionadas