Programa do Curso

Introdução ao Apache Spark

  • O papel do Spark no processamento de grandes volumes de dados
  • A arquitetura do Spark e os seus componentes

Configuração Apache Spark

  • Requisitos de hardware e software
  • Procedimentos de instalação para os modos autónomo e de cluster
  • Melhores práticas de configuração para administradores de sistemas

Administração de clusters do Spark

  • Ferramentas e técnicas de gerenciamento de cluster
  • Monitorização de aplicações Spark e recursos de cluster
  • Configurações de segurança e gestão de utilizadores

Ajuste e otimização de desempenho

  • Alocação e agendamento de recursos
  • Ajustar o Spark para obter o melhor desempenho
  • Identificação e resolução de gargalos comuns

Solução de problemas e resolução de problemas

  • Desafios comuns de administração do Spark
  • Ferramentas e técnicas de diagnóstico para a resolução de problemas
  • Abordagem passo-a-passo para resolver problemas comuns
  • Práticas recomendadas para manter um ambiente Spark saudável

Tópicos de administração avançada

  • Integração com outras ferramentas de Big Data
  • Garantia de alta disponibilidade e recuperação de desastres
  • Atualização e escalonamento de clusters do Spark

Resumo e próximos passos

Requisitos

  • Conhecimentos básicos de configuração e gestão de redes
  • Familiaridade com o sistema operativo Linux e a interface de linha de comandos
  • Interesse em aprender sobre sistemas de computação distribuída e gestão de grandes volumes de dados

Público-alvo

  • Administradores de sistemas
 35 horas

Número de participantes



Preço por participante

Declaração de Clientes (8)

Cursos Relacionados

Categorias Relacionadas