Início
Big Data Treinamento
Hadoop Treinamento
Curso de Hadoop for Developers (4 days)

Curso de Hadoop for Developers (4 days)

Apache Hadoop é o framework mais popular para processamento Big Data em clusters de servidores. Este curso introduzirá ao desenvolvedor aos diversos componentes (HDFS, MapReduce, Pig, Hive e HBase) do ecossistema Hadoop.

Obrigado por enviar sua consulta! Um dos membros da nossa equipe entrará em contato com você em breve.

Obrigado por enviar sua reserva! Um dos membros da nossa equipe entrará em contato com você em breve.

Programa do Curso

Seção 1: Introdução ao Hadoop

História e conceitos do Hadoop
ecossistema
distribuições
arquitetura de alto nível
mitos sobre o Hadoop
desafios do Hadoop
hardware / software
laboratório: primeira visão do Hadoop

Seção 2: HDFS

Design e arquitetura
conceitos (escalabilidade horizontal, replicação, localidade de dados, consciência de rack)
Daemons : NomeNode, Secondary NameNode, Data Node
comunicações / batimentos cardíacos
integridade dos dados
caminho de leitura/escrita
NomeNode Alta Disponibilidade (HA), Federação
laboratórios: Interagindo com o HDFS

Seção 3 : Map Reduce

conceitos e arquitetura
daemons (MRV1) : JobTracker / TaskTracker
fases: driver, mapper, shuffle/sort, reducer
MapReduce Versão 1 e Versão 2 (YARN)
Internos do MapReduce
Introdução ao programa de Java Map Reduce
laboratórios: Executando um programa de exemplo de MapReduce

Seção 4 : Pig

pig vs java map reduce
fluxo de trabalho do pig
linguagem Pig Latin
ETL com o Pig
transformações e junções
funções definidas pelo usuário (UDF)
laboratórios: escrevendo scripts Pig para análise de dados

Seção 5: Hive

arquitetura e design
tipos de dados
suporte a SQL no Hive
Criando tabelas em Hive e consultando
junções
processamento de texto
laboratórios: vários laboratórios sobre processamento de dados com o Hive

Seção 6: HBase

conceitos e arquitetura
HBase vs RDBMS vs Cassandra
HBase Java API
Dados de séries temporais no HBase
projeto do esquema
laboratórios: Interagindo com o HBase usando shell; programação na API HBase Java; exercícios de projeto de esquema

Requisitos

familiaridade com a linguagem de programação Java (a maioria dos exercícios de programação são em Java)
confortável no ambiente Linux (ser capaz de navegar na linha de comando do Linux, editar arquivos usando vi / nano)

Ambiente de laboratório

Sem Instalação : Não é necessário instalar software Hadoop nos computadores dos alunos! Um cluster funcional do Hadoop será fornecido para os alunos.

Os alunos precisarão das seguintes ferramentas

um cliente SSH (Linux e Mac já possuem clientes SSH, para Windows é recomendado o Putty)
um navegador para acessar o cluster, Firefox é recomendado

28 Horas

Número de participantes

Online

Sala de Aula

Como você quer fazer o curso?

Por favor selecione um Local

Preço por Participante

Os cursos de treinamento abertos exigem mais de 5 participantes.

Curso de Hadoop for Developers (4 days) - Booking

Nome Completo *

Email *

Telefone *

Posição na Empresa

Nome da Empresa

Endereço 1 *

Cidade *

Estado / Província

País *

Código postal *

Data de Início

Identificação Fiscal

As datas estão sujeitas à disponibilidade e ocorrem entre 09:30 e 16:30.

Pagamento *

Transferência Bancária (Fatura, PO)

Cartão de Débito/Crédito

Comentários

Permitir a publicação do certificado

Se você marcar esta caixa, os participantes receberão a opção de publicar seu certificado de curso no Catálogo de Profissionais Certificados da NobleProg.

Termos e Condições *

Sou um representante autorizado do cliente acima mencionado e desejo reservar os cursos ou serviços acima de acordo com os Termos e Condições e a Política de Privacidade da NobleProg.

Informe-me sobre descontos e promoções

Por favor, leia nossa Política de Privacidade para saber como utilizamos seus dados.

Curso de Hadoop for Developers (4 days) - Enquiry

Nome Completo *

Email *

Telefone *

Número de participantes

Nome da Empresa

Endereço da Empresa

Como você quer fazer o curso?

Instalações do Cliente

On-line

Sala de aula

Comentários

Informe-me sobre descontos e promoções

Por favor, leia nossa Política de Privacidade para saber como utilizamos seus dados.

Hadoop for Developers (4 days) - Solicitação de Consultoria

Solicitação de Consultoria

Nome Completo *

Telefone *

Email *

Nome da Empresa

Assunto de Consultoria *

Objetivo de Consultoria

Duração da Consultoria

Número de Consultores

Data de Preferência

Com quem o consultor irá trabalhar?

Urgência de Consultoria *

Comentários

Informe-me sobre descontos e promoções

Por favor, leia nossa Política de Privacidade para saber como utilizamos seus dados.

Declaração de Clientes (5)

Os exemplos ao vivo

Ahmet Bolat - Accenture Industrial SS

Curso - Python, Spark, and Hadoop for Big Data

Máquina Traduzida

Durante os exercícios, James explicou a mim cada etapa em mais detalhe sempre que eu ficava preso. Eu era completamente novo no NIFI. Ele explicou o propósito real do NIFI, inclusive conceitos básicos como o de código aberto. Ele abrangeu todos os conceitos do Nifi, partindo do nível iniciante até o nível de desenvolvedor.

Firdous Hashim Ali - MOD A BLOCK

Curso - Apache NiFi for Administrators

Máquina Traduzida

Preparação e organização do treinador e qualidade dos materiais fornecidos no github.

Mateusz Rek - MicroStrategy Poland Sp. z o.o.

Curso - Impala for Business Intelligence

Máquina Traduzida

Que eu tivesse no primeiro lugar.

Peter Scales - CACI Ltd

Curso - Apache NiFi for Developers

Máquina Traduzida

coisas práticas de fazer, além da teoria que foi bem explicada pelo Ajay

Dominik Mazur - Capgemini Polska Sp. z o.o.

Curso - Hadoop Administration on MapR

Máquina Traduzida

Próximas Formações Provisórias

Hadoop for Developers (4 days)

2025-09-16 09:30

28 Horas

Rio de Janeiro-Lagoa Rodrigo de Freitas Humaita

$ 10250 (On-line)

$ 11050 (Sala de aula)

Hadoop for Developers (4 days)

2025-09-30 09:30

28 Horas

Rio de Janeiro - O2 Corporativo

$ 10250 (On-line)

$ 11170 (Sala de aula)

Hadoop for Developers (4 days)

2025-10-14 09:30

28 Horas

Salvador-Suarez Trade

$ 10250 (On-line)

$ 10650 (Sala de aula)

Cursos Relacionados

Treinamento de Administrador para Apache Hadoop

35 Horas

Público-alvo:

O curso é destinado a especialistas em TI que procuram uma solução para armazenar e processar conjuntos grandes de dados em um ambiente de sistema distribuído.

Pré-requisitos:

Conhecimento profundo na administração de clusters Hadoop.

Leia mais...

Big Data Analytics in Health

21 Horas

A análise de big data envolve o processo de examinar grandes quantidades de conjuntos de dados variados para descobrir correlações, padrões ocultos e outras informações úteis.

A indústria da saúde tem enormes quantidades de dados médicos e clínicos heterogêneos complexos. A aplicação de análise de big data em dados de saúde apresenta um enorme potencial para obter insights para melhorar a prestação de serviços de saúde. No entanto, a enormidade desses conjuntos de dados apresenta grandes desafios em análises e aplicações práticas para um ambiente clínico.

Neste treinamento ao vivo conduzido por instrutor (remoto), os participantes aprenderão como executar a análise de big data na área da saúde enquanto realizam uma série de exercícios práticos de laboratório ao vivo.

No final deste treinamento, os participantes serão capazes de:

Instalar e configurar ferramentas de análise de big data, como o Hadoop MapReduce e o Spark
Entenda as características dos dados médicos
Aplicar técnicas de big data para lidar com dados médicos
Estudar grandes sistemas de dados e algoritmos no contexto de aplicações de saúde

Público

Desenvolvedores
Cientistas de dados

Formato do Curso

Palestra parte, parte discussão, exercícios e prática hands-on pesado.

Nota

Para solicitar um treinamento personalizado para este curso, entre em contato conosco para agendar.

Leia mais...

Administração Hadoop

21 Horas

O curso é dedicado a especialistas em TI que estão procurando uma solução para armazenar e processar grandes conjuntos de dados em um ambiente de sistema distribuído

Objetivo do curso:

Adquirir conhecimento sobre administração de cluster Hadoop

Leia mais...

Hadoop For Administrators

21 Horas

Apache Hadoop é o framework mais popular para processamento Big Data em clusters de servidores. Neste curso de três (opcionalmente, quatro) dias, os participantes aprenderão sobre os benefícios comerciais e casos de uso para Hadoop e seu ecossistema, como planejar a implantação e o crescimento do cluster, como instalar, manter, monitorar, solucionar problemas e otimizar Hadoop. Eles também praticarão o carregamento em massa de dados no cluster, se familiarizarão com várias distribuições Hadoop e praticarão a instalação e gerenciamento das ferramentas do ecossistema Hadoop. O curso termina com uma discussão sobre a segurança do cluster com Kerberos.

"... Os materiais foram muito bem preparados e abrangentes. A Labs foram muito úteis e bem organizadas"
— Andrew Nguyen, Engenheiro de Integração DW Principal, Microsoft Online Advertising

Público-Alvo

Administradores do Hadoop

Formato

Aulas e laboratórios práticos, aproximadamente 60% aulas, 40% labs.

Leia mais...

Advanced Hadoop for Developers

21 Horas

Apache Hadoop é um dos frameworks mais populares para processamento Big Data em clusters de servidores. Este curso aborda a gestão de dados no HDFS, Pig avançado, Hive, e HBase. Essas técnicas de programação avançadas serão benéficas para desenvolvedores experientes com Hadoop.

Público-alvo: desenvolvedores

Duração: três dias

Formato: palestras (50%) e laboratórios práticos (50%).

Leia mais...

Administração Hadoop no MapR

28 Horas

Público-alvo:

Este curso tem como objetivo desmistificar a tecnologia de big data/Hadoop e mostrar que ela não é difícil de entender.

Leia mais...

Hadoop and Spark for Administrators

35 Horas

Este treinamento ao vivo conduzido por instrutor em Brasil (online ou no local) é destinado a administradores de sistema que desejam aprender como configurar, implantar e gerenciar clusters Hadoop em sua organização.

No final desta formação, os participantes serão capazes de

Instalar e configurar o Apache Hadoop.
Compreender os quatro principais componentes do ecossistema Hadoop: HDFS, MapReduce, YARN e Hadoop Common.
Usar o HDFS (Hadoop Distributed File System) para dimensionar um cluster para centenas ou milhares de nós.
Configurar o HDFS para operar como mecanismo de armazenamento para implantações do Spark no local.
Configurar o Spark para acessar soluções de armazenamento alternativas, como Amazon S3 e sistemas de banco de dados NoSQL, como Redis, Elasticsearch, Couchbase, Aerospike, etc.
Realizar tarefas administrativas, como provisionamento, gerenciamento, monitoramento e segurança de um cluster Apache Hadoop.

Leia mais...

HBase for Developers

21 Horas

Este curso introduz HBase, e é dirigido a todos aqueles desenvolvedores que utilizarão o HBase para desenvolver aplicações, e administradores que vao manejar clusters HBase.

Vamos a guiar um desenvolvedor através da arquitetura HBase e modelagem de dados e desenvolvimento de aplicações em HBase. Também vamos discutir utilizando MapReduce com HBase, e alguns tópicos administrativos.

Duração : 3 dias

Público - alvo : desenvolvedores e administradores

Leia mais...

Hortonworks Data Platform (HDP) for Administrators

21 Horas

Este treinamento ao vivo conduzido por instrutor em Brasil (no local ou remoto) apresenta Hortonworks Data Platform (HDP) e orienta os participantes na implantação da solução Spark + Hadoop.

Ao final deste treinamento, os participantes serão capazes de:

Usar o Hortonworks para executar Hadoop de forma confiável em grande escala.
Unificar os recursos de segurança, governança e operações do Hadoop com os fluxos de trabalho analíticos ágeis do Spark.
Use a Hortonworks para investigar, validar, certificar e dar suporte a cada um dos componentes de um projeto Spark.
Processar diferentes tipos de dados, incluindo dados estruturados, não estruturados, em movimento e em repouso.

Leia mais...

Curso Análise de dados Hive/HiveQL

7 Horas

Este curso cobre o básico sobre como utilizar a linguagem Hive SQL, para todas aquelas pessoas que querem extraír dados do Hive. O objetivo deste curso é proporcionar todas as ferramentas necessárias para que os participantes possam analizar os dados de forma clara e precisa.

Leia mais...

Impala e a Inteligencia de Negócios

21 Horas

Cloudera Impala é um motor de consulta de processamento paralelo em larga escala (MPP) SQL de código aberto para clusters Apache Hadoop.

Impala permite que os usuários enviem consultas de baixa latência SQL a dados armazenados no Sistema de Arquivos Distribuído Hadoop e no Apache Hbase sem exigir movimentação ou transformação dos dados.

Público-alvo

Este curso é destinado a analistas e cientistas de dados que realizam análises em dados armazenados no Hadoop usando ferramentas Business Intelligence ou SQL.

Após este curso, os participantes serão capazes de

Extrair informações significativas de clusters Hadoop com o Impala.
Escriver programas específicos para facilitar a Business Intelligence no Impala em dialeto SQL.
Solucionar problemas do Impala.

Leia mais...

Apache NiFi for Administrators

21 Horas

Neste treinamento ao vivo conduzido por instrutor em Brasil (no local ou remoto), os participantes aprenderão como implantar e gerenciar Apache NiFi em um ambiente de laboratório ao vivo.

No final deste treinamento, os participantes serão capazes de:

Instalar e configurar o Apachi NiFi.
Fonte, transformar e gerenciar dados de fontes de dados díspares e distribuídas, incluindo bancos de dados e grandes lagos de dados.
Automatizar fluxos de dados.
Habilitar a análise de streaming.
Aplicar várias abordagens para a ingestão de dados.
Transformar Big Data em informações comerciais.

Leia mais...

Apache NiFi for Developers

7 Horas

Neste treinamento ao vivo conduzido por instrutor em Brasil, os participantes aprenderão os fundamentos da programação baseada em fluxo à medida que desenvolvem uma série de extensões de demonstração, componentes e processadores usando Apache NiFi.

No final deste treinamento, os participantes serão capazes de:

Compreender a arquitetura do NiFi e os conceitos de fluxo de dados.
Desenvolver extensões usando NiFi e APIs de terceiros.
Desenvolver seu próprio processador Apache Nifi.
Ingerir e processar dados em tempo real de formatos de arquivos e fontes de dados diferentes e incomuns.

Leia mais...

Python, Spark, and Hadoop for Big Data

21 Horas

Este treinamento ao vivo conduzido por instrutor em Brasil (no local ou remoto) é destinado a desenvolvedores que desejam usar e integrar o Spark, Hadoop e Python para processar, analisar e transformar conjuntos de dados grandes e complexos.

No final deste treinamento, os participantes serão capazes de:

Configurar o ambiente necessário para iniciar o processamento de big data com Spark, Hadoop e Python.
Compreender os recursos, componentes principais e arquitetura do Spark e Hadoop.
Aprender como integrar Spark, Hadoop e Python para o processamento de big data.
Explorar as ferramentas do ecossistema Spark (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka e Flume).
Construir sistemas de recomendação de filtragem colaborativa semelhantes a Netflix, YouTube, Amazon, Spotify e Google.
Utilizar o Apache Mahout para escalar algoritmos de aprendizagem automática.

Leia mais...

Curso de Hadoop for Developers (4 days)

Programa do Curso

Seção 1: Introdução ao Hadoop

Seção 2: HDFS

Seção 3 : Map Reduce

Seção 4 : Pig

Seção 5: Hive

Seção 6: HBase

Requisitos

Ambiente de laboratório

Declaração de Clientes (5)

Ahmet Bolat - Accenture Industrial SS

Curso - Python, Spark, and Hadoop for Big Data

Firdous Hashim Ali - MOD A BLOCK

Curso - Apache NiFi for Administrators

Mateusz Rek - MicroStrategy Poland Sp. z o.o.

Curso - Impala for Business Intelligence

Peter Scales - CACI Ltd

Curso - Apache NiFi for Developers

Dominik Mazur - Capgemini Polska Sp. z o.o.

Curso - Hadoop Administration on MapR

Próximas Formações Provisórias

Hadoop for Developers (4 days)

Hadoop for Developers (4 days)

Hadoop for Developers (4 days)

Categorias Relacionadas

Este site em outros países/regiões

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites