Programa do Curso

  1. Fundamentos de big data
    • Big Data e seu papel no mundo corporativo
    • As fases de desenvolvimento de uma Big Data estratégia dentro de uma corporação
    • Explique a lógica subjacente a uma abordagem holística para Big Data
    • Componentes necessários em uma plataforma Big Data
    • Solução de armazenamento de big data
    • Limites das tecnologias tradicionais
    • Visão geral dos tipos de banco de dados
    • As quatro dimensões de Big Data
  2. Impacto do big data nos negócios
    • Business importância de Big Data
    • Desafios de extrair dados úteis
    • Integrando Big Data com dados tradicionais
  3. Tecnologias de armazenamento de big data
    • Visão geral das tecnologias de big data
      • Modelos de armazenamento de dados
      • Hadoop
      • Hive
      • Cassandra
      • MongoDB
    • Escolhendo a tecnologia certa de big data
  4. Processando grandes dados
    • Conectando e extraindo dados do banco de dados
    • Transformação e preparação de dados para processamento
    • Usando Hadoop MapReduce para processamento de dados distribuídos
    • Monitorando e executando Hadoop jobs MapReduce
    • Hadoop blocos de construção de sistemas de arquivos distribuídos
    • Mapreduzir e Yarn
    • Manipulando dados de streaming com Spark
  5. Ferramentas e tecnologias de análise de big data
    • Programming Hadoop com língua latina Pig
    • Consultando big data com Hive
    • Mineração de dados com Mahout
    • Ferramentas de visualização e relatórios
  6. Big data nos negócios
    • Gerenciando e estabelecendo Big Data necessidades
    • Business importância de Big Data
    • Selecionando as ferramentas de big data certas para o problema

Conceitos de armazenamento de dados

  • O que é Data Ware House?
  • Diferença entre OLTP e alojamento de data ware
  • Aquisição de dados
  • Extração de dados
  • Transformação de dados.
  • Carregamento de dados
  • Datamarts
  • Data Mart Dependente vs Independente
  • Projeto de banco de dados

Conceitos de teste ETL:

  • Introdução.
  • Ciclo de vida de desenvolvimento de software.
  • Metodologias de teste.
  • Processo de fluxo de trabalho de teste de ETL.
  • Responsabilidades de teste de ETL no estágio de dados.

Fundamentos de big data

  • Big Data e seu papel no mundo corporativo
  • As fases de desenvolvimento de uma Big Data estratégia dentro de uma corporação
  • Explique a lógica subjacente a uma abordagem holística para Big Data
  • Componentes necessários em uma plataforma Big Data
  • Solução de armazenamento de big data
  • Limites das tecnologias tradicionais
  • Visão geral dos tipos de banco de dados

NoSQL Databases

Hadoop

Redução de mapa

Apache Spark

Requisitos

Os delegados devem ter conhecimento e alguma experiência de ferramentas de armazenamento e consciência do manuseamento de grandes conjuntos de dados

  14 horas

Número de participantes


Inicia

Termina


Dates are subject to availability and take place between 09:30 and 16:30.

Preço por participante

Declaração de Clientes (4)

Cursos Relacionados

Unified Batch and Stream Processing with Apache Beam

  14 horas

Categorias Relacionadas