Entrar em Contato

Programa do Curso

Arquitetura do Greenplum

  • Processamento paralelo e simétrico multiprocessado (SMP)
  • Funções dos segmentos e configuração do cluster
  • Escalabilidade e movimentação de dados
  • Arquitetura do Data Warehouse Greenplum

Estruturas de Tabelas do Greenplum

  • Tabelas distribuídas versus tabelas com distribuição aleatória
  • Tabelas Heap versus tabelas append-only
  • Formatos de armazenamento orientados a linhas versus orientados a colunas
  • Tabelas particionadas e clusterizadas

Distribuição de Dados e Hashing

  • Lógica de hashing e chaves de distribuição
  • Tratamento de desbalanceamento (skew) e seu impacto no desempenho
  • Mapas de hash e estratégias de posicionamento de linhas

Índices e Otimização de Desempenho

  • Índices clusterizados e não clusterizados
  • Casos de uso para índices B-tree e bitmap
  • Comportamento de varredura por índice e armazenamento

Projeto Físico do Banco de Dados

  • Normalização e projeto do modelo lógico
  • Estratégias de acesso dos usuários e análise de distribuição
  • Demografia dos dados e decisões sobre indexação

Técnicas de Desnormalização

  • Dados derivados, tabelas de resumo e pré-uniões (pre-joins)
  • Tabelas orientadas a colunas como particionamento vertical
  • Data marts e visões materializadas

SQL Avançado e Execução de Consultas

  • Estratégias de junção (join) e redistribuição
  • Funções OLAP e funções de janela
  • Tabelas temporárias, subconsultas e tabelas derivadas

Planos EXPLAIN e Tuning de Consultas

  • Leitura e interpretação da saída do EXPLAIN
  • Análise de custos e otimização de planos
  • Movimentação de junções e operações locais por segmento

Utilitários do Greenplum e Melhores Práticas

  • ANALYZE e VACUUM
  • Carregamento e movimentação de dados com o Nexus
  • Segurança, permissões e dicas de desempenho

Resumo e Próximos Passos

Requisitos

  • Compreensão de bancos de dados relacionais e SQL
  • Experiência com data warehouses ou sistemas analíticos
  • Familiaridade com operações na linha de comando do Linux

Público-alvo

  • Arquitetos e engenheiros de dados
  • Administradores de banco de dados e líderes técnicos
  • Desenvolvedores de BI e especialistas em análise que trabalham com Greenplum
 21 Horas

Número de participantes


Preço por participante

Testemunhos de Clientes (1)

Próximas Formações Provisórias

Categorias Relacionadas