Programa do Curso

Introdução

Instalação e Configuração do Dataiku Data Science Studio (DSS)

  • Requisitos de sistema para o Dataiku DSS
  • Configurando integrações com Apache Hadoop e Apache Spark
  • Configurando o Dataiku DSS com proxies web
  • Migração de outras plataformas para o Dataiku DSS

Visão Geral dos Recursos e Arquitetura do Dataiku DSS

  • Objetos principais e gráficos fundamentais para o Dataiku DSS
  • O que é uma receita no Dataiku DSS?
  • Tipos de conjuntos de dados suportados pelo Dataiku DSS

Criando um Projeto do Dataiku DSS

Definindo Conjuntos de Dados para Conectar-se a Recursos de Dados no Dataiku DSS

  • Trabalhando com conectores e formatos de arquivos do DSS
  • Formatos padrão do DSS vs. formatos específicos do Hadoop
  • Enviando Arquivos para um Projeto do Dataiku DSS

Visão Geral do Sistema de Arquivos do Servidor no Dataiku DSS

Criando e Usando Pastas Gerenciadas

  • Receita do Dataiku DSS para mesclar pastas
  • Pastas gerenciadas locais vs. não locais

Construindo um Conjunto de Dados de Sistema de Arquivos Usando o Conteúdo das Pastas Gerenciadas

  • Realizando limpezas com uma receita de código do DSS

Trabalhando com Conjunto de Dados Métricas e Conjunto de Dados Interno de Estatísticas

Implementando a Receita de Download do DSS para o Conjunto de Dados HTTP

Relocalizando Conjuntos de Dados SQL e HDFS Usando o DSS

Ordenando Conjuntos de Dados no Dataiku DSS

  • Ordenação do escritor vs. ordenação em tempo de leitura

Explorando e Preparando Visualizações de Dados para um Projeto do Dataiku DSS

Visão Geral dos Esquemas, Tipos de Armazenamento e Significados do Dataiku

Realizando Scripts de Limpeza, Normalização e Enriquecimento de Dados no Dataiku DSS

Trabalhando com a Interface de Gráficos do Dataiku DSS e Tipos de Agregações Visuais

Utilizando o Recurso de Estatísticas Interativas do DSS

  • Análise univariada vs. análise bivariada
  • Usando a ferramenta de Análise de Componentes Principais (PCA) do DSS

Visão Geral da Aprendizagem de Máquina com o Dataiku DSS

  • Aprendizado supervisionado vs. não supervisionado
  • Referências para algoritmos e recursos de aprendizado de máquina do DSS
  • Aprendizagem profunda com o Dataiku DSS

Visão Geral do Fluxo Derivado dos Conjuntos de Dados e Receitas do DSS

Transformando Conjuntos de Dados Existentes no DSS com Receitas Visuais

Utilizando Receitas do DSS Baseadas em Código Definido pelo Usuário

Otimizando a Exploração e Experimentação de Código com Notebooks de Código do DSS

Escrevendo Visualizações Avançadas do DSS e Recursos Personalizados do Frontend com Webapps

Trabalhando com o Recurso de Relatórios de Código do Dataiku DSS

Compartilhando Elementos de Projeto de Dados e Familiarizando-se com o Painel do DSS

Projetando e Embalando um Projeto do Dataiku DSS como uma Aplicação Reutilizável

Visão Geral de Métodos Avançados no Dataiku DSS

  • Implementando particionamento otimizado de conjuntos de dados usando o DSS
  • Executando partes específicas do processamento do DSS através de computações em contêineres Kubernetes

Visão Geral da Colaboração e Controle de Versão no Dataiku DSS

Implementando Cenários de Automação, Métricas e Verificações para Testes de Projeto do DSS

implantando e atualizando um projeto com o Nó de Automação do DSS e Pacotes

Trabalhando com APIs em Tempo Real no Dataiku DSS

  • APIs adicionais e APIs REST no DSS

Analisando e Previsões de Séries Temporais do Dataiku DSS

Segurança de um Projeto no Dataiku DSS

  • Gerenciando permissões de projeto e autorizações de painel
  • Implementando opções avançadas de segurança

Integrando o Dataiku DSS com a Nuvem

Solução de Problemas

Resumo e Conclusão

Requisitos

  • Experiência com as linguagens de programação Python, SQL e R
  • Conhecimento básico de processamento de dados com Apache Hadoop e Spark
  • Compreensão dos conceitos de machine learning e modelos de dados
  • Background em análises estatísticas e conceitos de ciência de dados
  • Experiência com visualização e comunicação de dados

Público-Alvo

  • Engenheiros
  • Cientistas de Dados
  • Analistas de Dados
 21 Horas

Número de participantes


Preço por Participante

Próximas Formações Provisórias

Categorias Relacionadas