Programa do Curso
Fundamentos do Armazenamento de Dados
- Propósito, componentes e arquitetura do warehouse
- Data marts, warehouses corporativos e padrões lakehouse
- Fundações OLTP vs OLAP e separação de cargas de trabalho
Modelagem Dimensional
- Fatos, dimensões e granularidade
- Eschema estrela vs esquema em cogumelo
- Tipo e tratamento das Dimensões com Mudança Lenta
Processos ETL e ELT
- Estratégias de extração de OLTP e APIs
- Transformações, limpeza de dados e conformidade
- Padrões de carga, orquestração e gerenciamento de dependências
Qualidade dos Dados e Gerenciamento de Metadados
- Perfilagem de dados e regras de validação
- Alinhamento de dados mestres e referência
- Genealogia, catálogos e documentação
Análise e Desempenho
- Conceitos de cubagem, agregações e views materializadas
- Agrupamento, clusterização e indexação para análise
- Gerenciamento de carga de trabalho, cache e otimização de consultas
Segurança e Governança
- Controle de acesso, papéis e segurança por nível de linha
- Considerações de conformidade e auditoria
- Práticas de backup, recuperação e confiabilidade
Arquiteturas Modernas
- Data warehouses na nuvem e elasticidade
- Ingestão em fluxo e análise quase em tempo real
- Otimização de custos e monitoramento
Capstone: Da Fonte ao Esquema Estrela
- Modelagem de um processo de negócios em fatos e dimensões
- Criação de uma fluxo de trabalho ETL ou ELT completo
- Publishing dashboards e validação de métricas
Resumo e Próximos Passos
Requisitos
- Compreensão de bancos de dados relacionais e SQL
- Experiência com análise ou relatórios de dados
- Familiaridade básica com plataformas de dados em nuvem ou on-premises
Público-alvo
- Analistas de dados transitando para armazenamento de dados
- Desenvolvedores BI e engenheiros ETL
- Arquitetos de dados e líderes de equipe
Declaração de Clientes (5)
Os exemplos ao vivo
Ahmet Bolat - Accenture Industrial SS
Curso - Python, Spark, and Hadoop for Big Data
Máquina Traduzida
muito interativo...
Richard Langford
Curso - SMACK Stack for Data Science
Máquina Traduzida
Suficiente prática, o instrutor é qualificado
Chris Tan
Curso - A Practical Introduction to Stream Processing
Máquina Traduzida
Aprenda sobre Spark Streaming, Databricks e AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Curso - Apache Spark in the Cloud
Máquina Traduzida
tarefas práticas
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Curso - Python and Spark for Big Data (PySpark)
Máquina Traduzida