Programa do Curso

Introdução a Data Analysis e Big Data

    O que torna Big Data “grande”? Velocidade, Volume, Variedade, Veracidade (VVVV)
Limites do processamento tradicional de dados
  • Processo de distribuição
  • Análise Estatística
  • Tipos de Machine Learning Análise
  • Data Visualization
  • Big Data Funções e responsabilidades
  • Administradores Desenvolvedores Analistas de dados

      Languages Usado para análise de dados

    R Language Por que R para análise de dados? Manipulação de dados, cálculo e exibição gráfica

      Python Por que Python para análise de dados?
    Manipulação, processamento, limpeza e processamento de dados
  • Abordagens para Data Analysis
  • Análise Estatística Análise de Séries Temporais Previsão com modelos de Correlação e Regressão Inferencial Statistics (estimativa) Descritivo Statistics em conjuntos de Big Data (por exemplo, cálculo de média)
  • Machine Learning Aprendizagem supervisionada versus não supervisionada

      Classificação e agrupamento
    Estimando o custo de métodos específicos
  • Filtragem
  • Processamento de linguagem natural Processamento de texto
  • Entendendo o significado do texto
  • Geração automática de texto
  • Análise de sentimento/análise de tópico
  • Computer Vision Aquisição, processamento, análise e compreensão de imagens
  • Reconstruir, interpretar e compreender cenas 3D
  • Usando dados de imagem para tomar decisões
  • Big Data Infraestrutura
  • Armazenamento de dados Bancos de dados relacionais (SQL) MeuSQL Postgres Oracle
  • Bancos de dados não relacionais (NãoSQL) Cassandra
  • MongoDB
  • Neo4js
  • Compreendendo as nuances dos bancos de dados hierárquicos

      Bancos de dados orientados a objetos
    Bancos de dados orientados a documentos
  • Bancos de dados orientados a gráficos
  • Outro
  • Processamento Distribuído Hadoop HDFS como um sistema de arquivos distribuído
  • MapReduce para processamento distribuído
  • Estrutura de computação em cluster na memória Spark All-in-one para processamento de dados em grande escala
  • Streaming estruturado
  • Faísca SQL
  • Machine Learning bibliotecas: MLlib
  • Processamento gráfico com GraphX
  • Scalabilidade Nuvem pública AWS, Google, Aliyun, etc.Nuvem privada OpenStack, Cloud Foundry, etc.
  • Escalabilidade automática
  • Escolhendo a solução certa para o problema
  • O futuro de Big Data
  • Resumo e conclusão
  • Requisitos

    • Uma compreensão geral da matemática.
    • Uma compreensão geral da programação.
    • Um conhecimento geral de bases de dados.

    Público

    • Desenvolvedores / programadores
    • Consultores de TI
     35 horas

    Número de participantes



    Preço por participante

    Declaração de Clientes (2)

    Cursos Relacionados

    Categorias Relacionadas