Programa do Curso
Introdução ao Apache Iceberg
- Visão geral do Apache Iceberg
- Revisão dos conceitos básicos
Aprofundamento na Arquitetura do Iceberg
- Análise detalhada do formato de tabela do Iceberg
- Visão geral detalhada da arquitetura, incluindo metadados e layout de arquivos
- Internos da evolução do esquema e das partições
Instalação e Configuração Avançadas
- Configurando o Iceberg para desempenho ótimo em diferentes ambientes
- Integração com várias engines de processamento de dados
- Configuração avançada: segurança, criptografia e controles de acesso
- Configurando o Iceberg em um ambiente distribuído
Operações e Manutenção Avançadas
- Gerenciamento de tabelas do Iceberg em larga escala
- Implementação e gerenciamento de mudanças complexas de esquema
- Tratando a evolução das partições e particionamento oculto
- Operações avançadas CRUD com mudanças de esquema e partição
Técnicas de Otimização de Consultas
- Técnicas para reduzir a latência das consultas
- Podagem de partições e arquivos
- Cache de metadados e estratégias de otimização
- Implementação e teste de técnicas de otimização de consultas
Ajuste de Desempenho para Datasets Grandes
- Otimização do desempenho para datasets em larga escala
- Uso dos recursos internos do Iceberg para ajuste de desempenho
- Estudos de caso sobre ajuste de desempenho em cenários do mundo real
- Ajuste de desempenho para datasets em larga escala
Migração e Integração Avançadas de Dados
- Migrando estruturas de dados complexas de outros sistemas
- Integrando o Iceberg com fluxos de dados em tempo real
- Migração de conjuntos de dados complexos e integração de fluxos de dados em tempo real
Confiabilidade e Consistência
- Garantindo a consistência e integridade dos dados em ambientes distribuídos
- Implementação e gerenciamento de garantias transacionais
- Tratando falhas e mecanismos de recuperação
- Implementando recursos de confiabilidade e consistência
Recursos Avançados e Personalização
- Implementações personalizadas de catálogos
- Extensão do Iceberg com recursos personalizados
- Implementando catálogos personalizados e estendendo as funcionalidades do Iceberg
Governança de Dados e Conformidade
- Implementação de políticas de governança de dados
- Conformidade com regulamentações de dados
- Gerenciamento de trilhas de auditoria e linhagem de dados
- Implementando recursos de governança e conformidade
Resumo e Próximos Passos
Requisitos
- Familiaridade com conceitos básicos, operações fundamentais e gerenciamento de tabelas Iceberg
Público-Alvo
- Engenheiros de dados
- Arquitetos de dados
- Analistas de dados
- Desenvolvedores de software
Declaração de Clientes (5)
Os exemplos ao vivo
Ahmet Bolat - Accenture Industrial SS
Curso - Python, Spark, and Hadoop for Big Data
Máquina Traduzida
muito interativo...
Richard Langford
Curso - SMACK Stack for Data Science
Máquina Traduzida
Suficiente prática, o instrutor é qualificado
Chris Tan
Curso - A Practical Introduction to Stream Processing
Máquina Traduzida
Aprenda sobre Spark Streaming, Databricks e AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Curso - Apache Spark in the Cloud
Máquina Traduzida
tarefas práticas
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Curso - Python and Spark for Big Data (PySpark)
Máquina Traduzida