Programa do Curso

Introdução

  • Compreendendo a importância da preparação de dados em analytics e aprendizado de máquina
  • Pipeline de preparação de dados e seu papel no ciclo de vida dos dados
  • Explorando desafios comuns em dados brutos e o impacto na análise

Coleta e Aquisição de Dados

  • Fontes de dados: bancos de dados, APIs, planilhas, arquivos de texto e mais
  • Técnicas para coletar dados e garantir a qualidade dos dados durante a coleta
  • Coletando dados de várias fontes

Técnicas de Limpeza de Dados

  • Identificando e lidando com valores ausentes, outliers e inconsistências
  • Lidando com duplicatas e erros no conjunto de dados
  • Limpeza de conjuntos de dados do mundo real

Transformação e Padronização de Dados

  • Técnicas de normalização e padronização de dados
  • Lidando com dados categóricos: codificação, agrupamento e engenharia de recursos
  • Transformando dados brutos em formatos utilizáveis

Integração e Agregação de Dados

  • Mesclando e combinando conjuntos de dados de diferentes fontes
  • Resolvendo conflitos de dados e alinhando tipos de dados
  • Técnicas para agregação e consolidação de dados

Garantia de Qualidade dos Dados

  • Métodos para garantir a qualidade e integridade dos dados durante todo o processo
  • Implementando verificações de qualidade e procedimentos de validação
  • Casos de estudo e aplicações práticas da garantia de qualidade dos dados

Redução de Dimensionalidade e Seleção de Recursos

  • Compreendendo a necessidade de redução de dimensionalidade
  • Técnicas como PCA, seleção de recursos e estratégias de redução
  • Implementando técnicas de redução de dimensionalidade

Resumo e Próximos Passos

Requisitos

  • Compreensão básica de conceitos de dados

Público-Alvo

  • Analistas de dados
  • Administradores de banco de dados
  • Profissionais de TI
 14 Horas

Número de participantes


Preço por Participante

Declaração de Clientes (2)

Próximas Formações Provisórias

Categorias Relacionadas