Programa do Curso

Introdução

  • O processo Data Science
  • Funções e responsabilidades de um cientista de dados

Preparar o ambiente de desenvolvimento

  • Bibliotecas, estruturas, linguagens e ferramentas
  • Desenvolvimento local
  • Desenvolvimento colaborativo baseado na Web

Recolha de dados

  • Diferentes tipos de dados
    • Estruturados
      • Bases de dados locais
      • Conectores Database
      • Formatos comuns: xlxs, XML, Json, csv, ...
    • Não estruturado
      • Cliques, censores, smartphones
      • APIs
      • Internet of Things (IoT)
      • Documentos, imagens, vídeos, sons
  • Estudo de caso: Recolha contínua de grandes quantidades de dados não estruturados

Armazenamento de dados

  • Bases de dados relacionais
  • Bases de dados não relacionais
  • Hadoop: Sistema de ficheiros distribuído (HDFS)
  • Spark: Conjunto de dados distribuído resiliente (RDD)
  • Armazenamento em nuvem

Preparação de dados

  • Ingestão, seleção, limpeza e transformação
  • Garantir a qualidade dos dados - correção, significado e segurança
  • Relatórios de exceção

Languages utilizados para preparação, processamento e análise

  • Linguagem R
    • Introdução ao R
    • Manipulação de dados, cálculo e visualização de gráficos
  • Python
    • Introdução à Python
    • Manipulação, processamento, limpeza e processamento de dados

Análise de dados

  • Análise exploratória
    • Estatísticas básicas
    • Esboço de visualizações
    • Compreender os dados
  • Causalidade
  • Caraterísticas e transformações
  • Machine Learning
    • Supervisionado vs não supervisionado
    • Quando utilizar que modelo
  • Natural Language Processing (NLP)

Data Visualization

  • Melhores práticas
  • Selecionar o gráfico certo para os dados certos
  • Paletes de cores
  • Passar ao nível seguinte
    • Painéis de controlo
    • Visualizações interactivas
  • Contar histórias com dados

Resumo e conclusão

Requisitos

  • Uma compreensão geral dos conceitos de bases de dados
  • Um conhecimento básico de estatística
 35 Horas

Número de participantes


Preço por Participante

Declaração de Clientes (3)

Próximas Formações Provisórias

Categorias Relacionadas