Curso de Programação de GPU - OpenCL vs CUDA vs ROCm

A programação de GPU é uma técnica que aproveita o poder de processamento paralelo das GPUs para acelerar aplicações que exigem alta performance computacional, como inteligência artificial, jogos, gráficos e computação científica. Existem diversos frameworks que permitem a programação de GPU, cada um com suas próprias vantagens e desvantagens. O OpenCL é um padrão aberto que pode ser usado para programar CPUs, GPUs e outros dispositivos de diferentes fabricantes, enquanto o CUDA é específico para GPUs da NVIDIA. O ROCm é uma plataforma que suporta programação de GPU em GPUs AMD e também oferece compatibilidade com CUDA e OpenCL.

Este treinamento ao vivo com instrutor (online ou presencial) é direcionado a desenvolvedores de nível básico a intermediário que desejam utilizar diferentes frameworks para programação de GPU e comparar suas funcionalidades, desempenho e compatibilidade.

Ao final deste treinamento, os participantes serão capazes de:

Configurar um ambiente de desenvolvimento que inclua o OpenCL SDK, o CUDA Toolkit, a Plataforma ROCm, um dispositivo que suporte OpenCL, CUDA ou ROCm e o Visual Studio Code.
Criar um programa básico de GPU que realiza adição de vetores usando OpenCL, CUDA e ROCm, e comparar a sintaxe, estrutura e execução de cada framework.
Utilizar as APIs respectivas para consultar informações do dispositivo, alocar e liberar memória do dispositivo, copiar dados entre o host e o dispositivo, lançar kernels e sincronizar threads.
Utilizar as linguagens respectivas para escrever kernels que executam no dispositivo e manipulam dados.
Utilizar as funções internas, variáveis e bibliotecas respectivas para realizar tarefas e operações comuns.
Utilizar os respectivos espaços de memória, como global, local, constante e privado, para otimizar transferências de dados e acessos à memória.
Utilizar os respectivos modelos de execução para controlar as threads, blocos e grades que definem o paralelismo.
Depurar e testar programas de GPU utilizando ferramentas como CodeXL, CUDA-GDB, CUDA-MEMCHECK e NVIDIA Nsight.
Otimizar programas de GPU usando técnicas como coalescência, cacheamento, pré-busca (prefetching) e perfilamento (profiling).

Formato do Curso

Palestra interativa e discussão.
Muitos exercícios e prática.
Implementação prática em um ambiente de laboratório ao vivo.

Opções de Personalização do Curso

Para solicitar um treinamento personalizado para este curso, entre em contato conosco para organizar.

Recife-Cicero Dias Shopping Center Recife

$ 11275 (On-line)

$ 13275 (Sala de aula)

Curso de Programação de GPU - OpenCL vs CUDA vs ROCm

Programa do Curso

Requisitos

Próximas Formações Provisórias

Programação de GPU - OpenCL vs CUDA vs ROCm

Programação de GPU - OpenCL vs CUDA vs ROCm

Programação de GPU - OpenCL vs CUDA vs ROCm

Programação de GPU - OpenCL vs CUDA vs ROCm

Programação de GPU - OpenCL vs CUDA vs ROCm

Categorias Relacionadas

Este site em outros países/regiões

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

Curso de Programação de GPU - OpenCL vs CUDA vs ROCm

Programa do Curso

Requisitos

Próximas Formações Provisórias

Programação de GPU - OpenCL vs CUDA vs ROCm

Programação de GPU - OpenCL vs CUDA vs ROCm

Programação de GPU - OpenCL vs CUDA vs ROCm

Programação de GPU - OpenCL vs CUDA vs ROCm

Programação de GPU - OpenCL vs CUDA vs ROCm

Cursos Relacionados

Desenvolvimento de Aplicações de IA com Huawei Ascend e CANN

Implantação de Modelos de IA com CANN e Processadores AI Ascend

Inferência e Implantação de IA com CloudMatrix

Programação de GPU em Aceleradores Biren

Desenvolvimento de MLU da Cambricon com BANGPy e Neuware

Introdução ao CANN para Desenvolvedores de Frameworks de IA

CANN para Implantação de IA na Borda

Compreendendo o Stack de Computação em IA da Huawei: De CANN a MindSpore

Otimização do Desempenho de Redes Neurais com o SDK CANN

SDK CANN para Pipelines de Visão Computacional e PLN

Construção de Operadores Personalizados de IA com CANN TIK e TVM

Migrando Aplicações CUDA para Arquiteturas de GPU Chinesas

Otimização de Performance na Ascend, Biren e Cambricon

Categorias Relacionadas

GPU

Este site em outros países/regiões

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites