Programa do Curso
Introdução
Instalação e configuração do Dataiku Data Science Studio (DSS)
- Requisitos de sistema para o Dataiku DSS
- Configuração das integrações do Apache Hadoop e do Apache Spark
- Configuração de Dataiku DSS com proxies web
- Migração de outras plataformas para Dataiku DSS
Descrição geral das características e da arquitetura do Dataiku DSS
- Objectos principais e gráficos fundamentais para o Dataiku DSS
- O que é uma receita em Dataiku DSS?
- Tipos de conjuntos de dados suportados por Dataiku DSS
Criar um projeto Dataiku DSS
Definição de conjuntos de dados para ligação a recursos de dados no Dataiku DSS
- Trabalhar com conectores DSS e formatos de ficheiro
- Formatos padrão de DSS v.s. formatos específicos de Hadoop
- Carregamento de ficheiros para um projeto Dataiku DSS
Visão geral do sistema de arquivos do servidor no Dataiku DSS
Criar e utilizar pastas geridas
- Receita Dataiku DSS para pasta de fusão
- Pastas geridas locais e não locais
Construção de um conjunto de dados do sistema de arquivos usando conteúdo de pastas gerenciadas
- Execução de limpezas com uma receita de código DSS
Trabalhar com o conjunto de dados de métricas e o conjunto de dados de estatísticas internas
Implementação da receita de download do DSS para o conjunto de dados HTTP
Realocação de conjuntos de dados SQL e conjuntos de dados HDFS usando DSS
Ordenação de conjuntos de dados no Dataiku DSS
- Ordenação do escritor vs. ordenação do tempo de leitura
Exploração e preparação de imagens de dados para um projeto Dataiku DSS
Visão geral dos esquemas, tipos de armazenamento e significados do Dataiku
Execução de scripts de limpeza, normalização e enriquecimento de dados no Dataiku DSS
Trabalhar com a interface Dataiku DSS Charts e tipos de agregações visuais
Utilização da funcionalidade interactiva Statistics do DSS
- Análise univariada versus análise bivariada
- Utilização da ferramenta DSS de análise de componentes principais (PCA)
Visão geral de Machine Learning com o Dataiku DSS
- ML supervisionado vs. ML não supervisionado
- Referências para DSS ML Algoritmos e tratamento de características
- Deep Learning com Dataiku DSS
Visão geral do fluxo derivado dos conjuntos de dados e receitas do DSS
Transformar conjuntos de dados existentes em DSS com receitas visuais
Utilização de receitas DSS baseadas em código definido pelo utilizador
Otimização da exploração e experimentação de código com os cadernos de código DSS
Escrever visualizações avançadas de DSS e funcionalidades de front-end personalizadas com Webapps
Trabalhar com a funcionalidade Dataiku DSS Code Reports
Partilha de dados do projeto Elements e familiarização com o painel de controlo do DSS
Conceber e empacotar um projeto Dataiku DSS como uma aplicação reutilizável
Síntese de métodos avançados no Dataiku DSS
- Implementação de particionamento optimizado de conjuntos de dados utilizando DSS
- Execução de partes específicas do processamento de DSS através de cálculos em contentores Kubernetes
Síntese de Collaboration e controlo de versões no Dataiku DSS
Implementação de cenários de automatização, métricas e verificações para testes de projectos DSS
Implantação e atualização de um projeto com o nó de automação DSS e pacotes
Trabalhar com APIs em tempo real no Dataiku DSS
- APIs adicionais e APIs Rest em DSS
Analisar e Forecasting Dataiku DSS Séries temporais
Proteger um projeto no Dataiku DSS
- Gerir as permissões do projeto e as autorizações do painel de controlo
- Implementar opções de segurança avançadas
Integração do Dataiku DSS com a nuvem
Resolução de problemas
Resumo e conclusão
Requisitos
- Experiência com as linguagens de programação Python, SQL e R
- Conhecimento básico de processamento de dados com Apache Hadoop e Spark
- Compreensão de conceitos de machine learning e modelos de dados
- Antecedentes em análises estatísticas e conceitos de ciência de dados
- Experiência com visualização e comunicação de dados
Público
- Engenheiros
- Cientistas de dados
- Analistas de dados