Programa do Curso
Introdução
- Visão geral das características e da arquitetura do Spark e Hadoop
- Compreender os grandes volumes de dados
- Python noções básicas de programação
Primeiros passos
- Configurar o Python, o Spark e o Hadoop
- Compreender as estruturas de dados em Python
- Compreender a API PySpark
- Compreender o HDFS e o MapReduce
Integrando Spark e Hadoop com Python
- Implementar o Spark RDD em Python
- Processar dados usando MapReduce
- Criando conjuntos de dados distribuídos no HDFS
Machine Learning com Spark MLlib
Processando Big Data com Spark Streaming
Trabalhar com sistemas de recomendação
Trabalhar com Kafka, Sqoop, Kafka e Flume
Apache Mahout com Spark e Hadoop
Solução de problemas
Resumo e próximos passos
Requisitos
- Experiência com Spark e Hadoop
- Python experiência em programação
Público
- Cientistas de dados
- Programadores
Declaração de Clientes (3)
O fato de termos conseguido levar conosco a maior parte das informações/apresentações/exercícios do curso, para que possamos revisá-los e talvez refazer o que não entendemos à primeira vez ou melhorar o que já fizemos.
Raul Mihail Rat - Accenture Industrial SS
Curso - Python, Spark, and Hadoop for Big Data
Máquina Traduzida
Gostei de como conseguiu estabelecer as bases do tópico e avançar para exercícios bastante avançados. Também ofereceu maneiras fáceis de escrever/testar o código.
Ionut Goga - Accenture Industrial SS
Curso - Python, Spark, and Hadoop for Big Data
Máquina Traduzida
Os exemplos ao vivo
Ahmet Bolat - Accenture Industrial SS
Curso - Python, Spark, and Hadoop for Big Data
Máquina Traduzida