Programa do Curso
Introdução ao Google Colab e ao Apache Spark
- Descrição geral do Google Colab
- Introdução ao Apache Spark
- Configurar o Spark no Google Colab
Processamento de dados com Apache Spark
- Trabalhar com RDDs e DataFrames
- Carregamento e processamento de grandes conjuntos de dados
- Usando o Spark SQL para consultar dados estruturados
Análise avançada com o Spark
- Aprendizagem automática com o Spark MLlib
- Realização de análises de dados em tempo real
- Computação distribuída com o Spark
Visualização e Collaboration em Google Colab
- Integração do Colab com bibliotecas de visualização populares
- Fluxos de trabalho colaborativos com notebooks do Colab
- Partilhar e exportar resultados
Otimizar Big Data Fluxos de trabalho
- Ajustar o Spark para desempenho
- Otimizar a utilização da memória e do armazenamento
- Escalonamento de fluxos de trabalho para grandes conjuntos de dados
Big Data na nuvem
- Integrar o Google Colab com ferramentas baseadas na nuvem
- Utilizar o armazenamento na nuvem para grandes dados
- Trabalhar com o Spark em ambientes de nuvem distribuídos
Estudos de caso e melhores práticas
- Revisão de aplicações de grandes volumes de dados do mundo real
- Estudos de casos utilizando o Apache Spark e o Colab
- Práticas recomendadas para análise de big data
Resumo e próximos passos
Requisitos
- Conhecimento básico dos conceitos de ciência de dados
- Familiaridade com Apache Spark
- Python competências de programação
Público-alvo
- Cientistas de dados
- Engenheiros de dados
- Investigadores que trabalham com grandes volumes de dados
Declaração de Clientes (5)
Exemplos práticos nos permitiram ter uma verdadeira noção de como o programa funciona. Explicações detalhadas e integração de conceitos teóricos e sua relação com aplicações práticas.
Ian - Archeoworks Inc.
Curso - ArcGIS Fundamentals
Máquina Traduzida
Exercício de laboratório
Tse Kiat - ST Engineering Training & Simulation Systems Pte. Ltd.
Curso - Automated Monitoring with Zabbix
Máquina Traduzida
Todos os tópicos que ele abordou, incluindo exemplos. E também explicou como eles são úteis no nosso trabalho diário.
madduri madduri - Boskalis Singapore Pte Ltd
Curso - QGIS for Geographic Information System
Máquina Traduzida
Gostei do estilo do Pablo, do facto de ter abordado muitos assuntos, desde a conceção de relatórios, personalização com html até à implementação de algoritmos ML simples. Good equilíbrio informação teórica / exercícios. O Pablo cobriu realmente todos os tópicos que me interessavam e deu respostas completas às minhas perguntas.
Cristian Tudose - SC Automobile Dacia SA
Curso - Advanced Data Analysis with TIBCO Spotfire
Máquina Traduzida
Aplicação prática do Spotfire e todas as funções básicas.
Michael Capili - STMicroelectronics, Inc.
Curso - Introduction to Spotfire
Máquina Traduzida