Programa do Curso
Secção 1: Data Management no HDFS
- Vários formatos de dados (JSON / Avro / Parquet)
- Esquemas de compressão
- Mascaramento de dados
- Laboratórios: Analisando diferentes formatos de dados; permitindo a compressão
Secção 2: Pig avançado
- Funções definidas pelo utilizador
- Introdução às bibliotecas Pig (ElephantBird / Data-Fu)
- Carregando dados estruturados complexos usando Pig
- Ajuste do Pig
- Laboratórios: scripting pig avançado, análise de tipos de dados complexos
Secção 3 : Avançado Hive
- Funções definidas pelo utilizador
- Tabelas comprimidas
- Hive Ajuste de desempenho
- Laboratórios: criando tabelas comprimidas, avaliando formatos de tabela e configuração
Secção 4 : HBase avançado
- Modelagem avançada de esquemas
- Compressão
- Ingestão de dados em massa
- Comparação entre tabela ampla e tabela alta
- HBase e Pig
- HBase e Hive
- Ajuste de desempenho do HBase
- Laboratórios: afinação do HBase; acesso aos dados do HBase a partir do Pig & Hive; utilização do Phoenix para modelação de dados
Requisitos
- à vontade com Java linguagem de programação (a maior parte dos exercícios de programação são em java)
- facilidade de utilização do ambiente Linux (ser capaz de navegar na linha de comandos Linux, editar ficheiros usando vi / nano)
- um conhecimento prático de Hadoop.
Ambiente de laboratório
Instalação zero: Não há necessidade de instalar o software hadoop nas máquinas dos alunos! Um cluster hadoop funcional será fornecido aos alunos.
Os alunos precisarão do seguinte
- um cliente SSH (Linux e Mac já têm clientes ssh, para Windows recomenda-se Putty )
- um browser para aceder ao cluster. Recomendamos o browser Firefox
Declaração de Clientes (5)
Os exemplos ao vivo
Ahmet Bolat - Accenture Industrial SS
Curso - Python, Spark, and Hadoop for Big Data
Máquina Traduzida
Durante os exercícios, James explicou a mim cada etapa em mais detalhe sempre que eu ficava preso. Eu era completamente novo no NIFI. Ele explicou o propósito real do NIFI, inclusive conceitos básicos como o de código aberto. Ele abrangeu todos os conceitos do Nifi, partindo do nível iniciante até o nível de desenvolvedor.
Firdous Hashim Ali - MOD A BLOCK
Curso - Apache NiFi for Administrators
Máquina Traduzida
Preparação e organização do treinador e qualidade dos materiais fornecidos no github.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Curso - Impala for Business Intelligence
Máquina Traduzida
Que eu tivesse no primeiro lugar.
Peter Scales - CACI Ltd
Curso - Apache NiFi for Developers
Máquina Traduzida
coisas práticas de fazer, além da teoria que foi bem explicada pelo Ajay
Dominik Mazur - Capgemini Polska Sp. z o.o.
Curso - Hadoop Administration on MapR
Máquina Traduzida