Programa do Curso
Introdução ao Apache Iceberg
- Visão geral do Apache Iceberg
- Importância e casos de uso na arquitetura de dados moderna
- Principais recursos e benefícios
Conceitos Fundamentais
- Formato e arquitetura das tabelas Iceberg
- Comparação com outros formatos de tabela
- Particionamento e evolução do esquema
- Viagem no tempo e versionamento de dados
Configurando o Apache Iceberg
- Instalação e configuração
- Integração do Iceberg com diversos motores de processamento de dados
- Configurando um ambiente Iceberg em uma máquina local
Operações Básicas
- Criação e gerenciamento de tabelas Iceberg
- Gravação e leitura em tabelas Iceberg
- Operações CRUD básicas
Migração de Dados e Integração
- Migração de dados do Hive e outros sistemas para o Iceberg
- Integração com ferramentas de BI
- Migração de um conjunto de dados de exemplo para o Iceberg
Otimização de Desempenho
- Técnicas de otimização de desempenho
- Otimização de consultas e varreduras de dados
- Otimização de desempenho no Iceberg
Visão Geral dos Recursos Avançados
- Evolução da partição e particionamento oculto
- Evolução de tabelas e alterações no esquema
- Viagem no tempo e recursos de rollback
- Implementação de recursos avançados no Iceberg
Resumo e Próximos Passos
Requisitos
- Familiaridade com conceitos como tabelas, esquemas, partições e ingestão de dados
- Conhecimento básico de SQL
Público-Alvo
- Engenheiros de dados
- Arquitetos de dados
- Analistas de dados
- Desenvolvedores de software
Declaração de Clientes (5)
Os exemplos ao vivo
Ahmet Bolat - Accenture Industrial SS
Curso - Python, Spark, and Hadoop for Big Data
Máquina Traduzida
muito interativo...
Richard Langford
Curso - SMACK Stack for Data Science
Máquina Traduzida
Suficiente prática, o instrutor é qualificado
Chris Tan
Curso - A Practical Introduction to Stream Processing
Máquina Traduzida
Aprenda sobre Spark Streaming, Databricks e AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Curso - Apache Spark in the Cloud
Máquina Traduzida
tarefas práticas
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Curso - Python and Spark for Big Data (PySpark)
Máquina Traduzida