Programa do Curso

[1. Visão Geral:

  • O que é Big Data
  • Por que Big Data está ganhando popularidade
  • Big Data Estudos de caso
  • Big Data Características
  • Soluções para trabalhar Big Data.

Hadoop e seus componentes:

  • O que é Hadoop e quais são seus componentes.
  • Hadoop Arquitetura e suas características de Dados que ela pode manipular/Processo.
  • Resumo sobre Hadoop História, empresas que o utilizam e por que começaram a usá-lo.
  • Hadoop Estrutura e seus componentes - explicados em detalhes.
  • O que é HDFS e leituras -gravações em Hadoop sistema de arquivos distribuído.
  • Como configurar Hadoop Cluster em diferentes modos - cluster autônomo/pseudo/multinó.

(Isso inclui a configuração de um Hadoop cluster no VirtualBox/KVM/VMware, configurações de rede que precisam ser examinadas cuidadosamente, execução de Hadoop Daemons e teste do cluster).

  • O que é o quadro Map Reduce e como ele funciona.
  • Executando jobs do Map Reduce no cluster Hadoop.
  • Noções básicas sobre replicação, espelhamento e reconhecimento de rack no contexto de Hadoop clusters.

Hadoop Planejamento de Cluster:

  • Como planejar seu cluster hadoop.
  • Noções básicas sobre hardware-software para planejar seu cluster hadoop.
  • Compreender as cargas de trabalho e planejar o cluster para evitar falhas e ter um desempenho ideal.

O que é MapR e por que MapR:

  • Visão geral do MapR e sua arquitetura.
  • Compreensão e funcionamento do sistema de controle MapR, volumes MapR, instantâneos e espelhos.
  • Planejando um cluster no contexto do MapR.
  • Comparação do MapR com outras distribuições e Apache Hadoop.
  • Instalação do MapR e implantação de cluster.

Configuração e administração de cluster:

  • Gerenciando serviços, nós, instantâneos, volumes espelhados e clusters remotos.
  • Compreendendo e gerenciando nós.
  • Compreensão de Hadoop componentes, instalação de Hadoop componentes junto com MapR Services.
  • Accessing Dados no cluster, inclusive por meio de serviços e nós de gerenciamento NFS.
  • Gerenciamento de dados usando volumes, gerenciamento de usuários e grupos, gerenciamento e atribuição de funções a nós, comissionamento, descomissionamento de nós, administração de cluster e monitoramento de desempenho, configuração/análise e monitoramento de métricas para monitorar desempenho, configuração e administração de segurança MapR.
  • Compreender e trabalhar com M7- Armazenamento nativo para tabelas MapR.
  • Configuração e ajuste de cluster para desempenho ideal.

Atualização do cluster e integração com outras configurações:

  • Atualização da versão do software do MapR e tipos de atualização.
  • Configurando o cluster Mapr para acessar o cluster HDFS.
  • Configurando cluster MapR no Amazon Elastic Mapreduce.

Todos os tópicos acima incluem demonstrações e sessões práticas para que os alunos tenham experiência prática com a tecnologia.

Requisitos

  • Conhecimento básico de Linux FS
  • Java básico
  • Conhecimentos de Apache Hadoop (recomendado)
 28 horas

Número de participantes



Preço por participante

Declaração de Clientes (1)

Cursos Relacionados

Categorias Relacionadas