Programa do Curso
Introdução
Instalação e Configuração do Dataiku Data Science Studio (DSS)
- Requisitos de sistema para o Dataiku DSS
- Configurando integrações com Apache Hadoop e Apache Spark
- Configurando o Dataiku DSS com proxies web
- Migração de outras plataformas para o Dataiku DSS
Visão Geral dos Recursos e Arquitetura do Dataiku DSS
- Objetos principais e gráficos fundamentais para o Dataiku DSS
- O que é uma receita no Dataiku DSS?
- Tipos de conjuntos de dados suportados pelo Dataiku DSS
Criando um Projeto do Dataiku DSS
Definindo Conjuntos de Dados para Conectar-se a Recursos de Dados no Dataiku DSS
- Trabalhando com conectores e formatos de arquivos do DSS
- Formatos padrão do DSS vs. formatos específicos do Hadoop
- Enviando Arquivos para um Projeto do Dataiku DSS
Visão Geral do Sistema de Arquivos do Servidor no Dataiku DSS
Criando e Usando Pastas Gerenciadas
- Receita do Dataiku DSS para mesclar pastas
- Pastas gerenciadas locais vs. não locais
Construindo um Conjunto de Dados de Sistema de Arquivos Usando o Conteúdo das Pastas Gerenciadas
- Realizando limpezas com uma receita de código do DSS
Trabalhando com Conjunto de Dados Métricas e Conjunto de Dados Interno de Estatísticas
Implementando a Receita de Download do DSS para o Conjunto de Dados HTTP
Relocalizando Conjuntos de Dados SQL e HDFS Usando o DSS
Ordenando Conjuntos de Dados no Dataiku DSS
- Ordenação do escritor vs. ordenação em tempo de leitura
Explorando e Preparando Visualizações de Dados para um Projeto do Dataiku DSS
Visão Geral dos Esquemas, Tipos de Armazenamento e Significados do Dataiku
Realizando Scripts de Limpeza, Normalização e Enriquecimento de Dados no Dataiku DSS
Trabalhando com a Interface de Gráficos do Dataiku DSS e Tipos de Agregações Visuais
Utilizando o Recurso de Estatísticas Interativas do DSS
- Análise univariada vs. análise bivariada
- Usando a ferramenta de Análise de Componentes Principais (PCA) do DSS
Visão Geral da Aprendizagem de Máquina com o Dataiku DSS
- Aprendizado supervisionado vs. não supervisionado
- Referências para algoritmos e recursos de aprendizado de máquina do DSS
- Aprendizagem profunda com o Dataiku DSS
Visão Geral do Fluxo Derivado dos Conjuntos de Dados e Receitas do DSS
Transformando Conjuntos de Dados Existentes no DSS com Receitas Visuais
Utilizando Receitas do DSS Baseadas em Código Definido pelo Usuário
Otimizando a Exploração e Experimentação de Código com Notebooks de Código do DSS
Escrevendo Visualizações Avançadas do DSS e Recursos Personalizados do Frontend com Webapps
Trabalhando com o Recurso de Relatórios de Código do Dataiku DSS
Compartilhando Elementos de Projeto de Dados e Familiarizando-se com o Painel do DSS
Projetando e Embalando um Projeto do Dataiku DSS como uma Aplicação Reutilizável
Visão Geral de Métodos Avançados no Dataiku DSS
- Implementando particionamento otimizado de conjuntos de dados usando o DSS
- Executando partes específicas do processamento do DSS através de computações em contêineres Kubernetes
Visão Geral da Colaboração e Controle de Versão no Dataiku DSS
Implementando Cenários de Automação, Métricas e Verificações para Testes de Projeto do DSS
implantando e atualizando um projeto com o Nó de Automação do DSS e Pacotes
Trabalhando com APIs em Tempo Real no Dataiku DSS
- APIs adicionais e APIs REST no DSS
Analisando e Previsões de Séries Temporais do Dataiku DSS
Segurança de um Projeto no Dataiku DSS
- Gerenciando permissões de projeto e autorizações de painel
- Implementando opções avançadas de segurança
Integrando o Dataiku DSS com a Nuvem
Solução de Problemas
Resumo e Conclusão
Requisitos
- Experiência com as linguagens de programação Python, SQL e R
- Conhecimento básico de processamento de dados com Apache Hadoop e Spark
- Compreensão dos conceitos de machine learning e modelos de dados
- Background em análises estatísticas e conceitos de ciência de dados
- Experiência com visualização e comunicação de dados
Público-Alvo
- Engenheiros
- Cientistas de Dados
- Analistas de Dados