Início
Big Data Treinamento
Apache Spark Treinamento
Curso de SMACK Stack for Data Science

Curso de SMACK Stack for Data Science

SMACK é uma coleção de software de plataforma de dados, nomeadamente Apache Spark, Apache Mesos, Apache Akka, Apache Cassandra, e Apache Kafka. Usando a faixa SMACK, os usuários podem criar e escalar plataformas de processamento de dados.

Este treinamento guiado por instrutores, ao vivo (online ou on-site) é dirigido a cientistas de dados que desejam usar a faixa SMACK para construir plataformas de processamento de dados para soluções de big data.

No final do curso, os participantes poderão:

Implementar uma arquitetura de tubos de dados para o processamento de grandes dados.
Desenvolver uma infraestrutura de cluster com Apache Mesos e Docker.
Análise de dados com o Spark e Scala.
Gerenciar dados não estruturados com o Apache Cassandra.

O formato do curso

Interação e discussão interativa.
Muitos exercícios e práticas.
Implementação de mão em um ambiente de laboratório ao vivo.

Opções de Customização

Para solicitar uma formação personalizada para este curso, por favor contacte-nos para organizar.

Obrigado por enviar sua consulta! Um dos membros da nossa equipe entrará em contato com você em breve.

Obrigado por enviar sua reserva! Um dos membros da nossa equipe entrará em contato com você em breve.

Programa do Curso

Introdução

Visão geral do SMACK Stack

O que é o Apache Spark? Características do Apache Spark
O que é o Apache Mesos? Recursos do Apache Mesos
O que é o Apache Akka? Funcionalidades do Apache Akka
O que é o Apache Cassandra? Recursos do Apache Cassandra
O que é o Apache Kafka? Funcionalidades do Apache Kafka

Scala Língua

Scala sintaxe e estrutura
Scala fluxo de controlo

Preparando o ambiente de desenvolvimento

Instalar e configurar a pilha SMACK
Instalando e configurando Docker

Apache Akka

Utilização de actores

Apache Cassandra

Criar uma base de dados para operações de leitura
Trabalhar com cópias de segurança e recuperação

Conectores

Criando um fluxo
Construindo uma aplicação Akka
Armazenando dados com Cassandra
Revisando conectores

Apache Kafka

Trabalhar com clusters
Criação, publicação e consumo de mensagens

Apache Mesos

Atribuição de recursos
Executar clusters
Trabalhar com o Apache Aurora e Docker
Executar serviços e trabalhos
Implantar o Spark, o Cassandra e o Kafka no Mesos

Apache Spark

Gerir fluxos de dados
Trabalhar com RDDs e quadros de dados
Efetuar análises de dados

Resolução de problemas

Tratamento de falhas de serviços e erros

Resumo e conclusão

Requisitos

Compreensão dos sistemas de tratamento de dados

Público

Cientistas de dados

14 Horas

Número de participantes

Online

Sala de Aula

Como você quer fazer o curso?

Por favor selecione um Local

Preço por Participante

Os cursos de treinamento abertos exigem mais de 5 participantes.

Curso de SMACK Stack for Data Science - Booking

Nome Completo *

Email *

Telefone *

Posição na Empresa

Nome da Empresa

Endereço 1 *

Cidade *

Estado / Província

País *

Código postal *

Data de Início

Identificação Fiscal

As datas estão sujeitas à disponibilidade e ocorrem entre 09:30 e 16:30.

Pagamento *

Transferência Bancária (Fatura, PO)

Cartão de Débito/Crédito

Comentários

Permitir a publicação do certificado

Se você marcar esta caixa, os participantes receberão a opção de publicar seu certificado de curso no Catálogo de Profissionais Certificados da NobleProg.

Termos e Condições *

Sou um representante autorizado do cliente acima mencionado e desejo reservar os cursos ou serviços acima de acordo com os Termos e Condições e a Política de Privacidade da NobleProg.

Informe-me sobre descontos e promoções

Por favor, leia nossa Política de Privacidade para saber como utilizamos seus dados.

Curso de SMACK Stack for Data Science - Enquiry

Nome Completo *

Email *

Telefone *

Número de participantes

Nome da Empresa

Endereço da Empresa

Como você quer fazer o curso?

Instalações do Cliente

On-line

Sala de aula

Comentários

Informe-me sobre descontos e promoções

Por favor, leia nossa Política de Privacidade para saber como utilizamos seus dados.

SMACK Stack for Data Science - Solicitação de Consultoria

Solicitação de Consultoria

Nome Completo *

Telefone *

Email *

Nome da Empresa

Assunto de Consultoria *

Objetivo de Consultoria

Duração da Consultoria

Número de Consultores

Data de Preferência

Com quem o consultor irá trabalhar?

Urgência de Consultoria *

Comentários

Informe-me sobre descontos e promoções

Por favor, leia nossa Política de Privacidade para saber como utilizamos seus dados.

Declaração de Clientes (1)

muito interativo...

Richard Langford

Curso - SMACK Stack for Data Science

Máquina Traduzida

Próximas Formações Provisórias

SMACK Stack for Data Science

2025-08-26 09:30

14 Horas

Porto Alegre - Platinum Building

$ 3937 (On-line)

$ 4237 (Sala de aula)

SMACK Stack for Data Science

2025-09-09 09:30

14 Horas

Porto Alegre - Centro Empresarial Guaíba

$ 3937 (On-line)

$ 4247 (Sala de aula)

SMACK Stack for Data Science

2025-09-23 09:30

14 Horas

Brasília - Corporate Financial Center

$ 3937 (On-line)

$ 4237 (Sala de aula)

SMACK Stack for Data Science

2025-10-07 09:30

14 Horas

Brasília - Parque Cidade Edifício Corporativo

$ 3937 (On-line)

$ 4337 (Sala de aula)

Cursos Relacionados

Inteligência de Negócios de Big Data para Provedores de Serviços de Telecomunicações e Comunicação

35 Horas

Visão geral

Communications provedores de serviços (CSP) estão enfrentando pressão para reduzir custos e maximizar o rendimento médio por usuário (ARPU), ao mesmo tempo que garantem uma excelente experiência de cliente, mas os volumes de dados continuam a crescer. O tráfego global de dados móveis crescerá a uma taxa de crescimento anual combinada (CAGR) de 78 por cento até 2016, atingindo 10,8 exabytes por mês.

Enquanto isso, os CSPs estão gerando grandes volumes de dados, incluindo registros de detalhes de chamadas (CDR), dados de rede e dados de clientes. As empresas que aproveitam plenamente esses dados ganham um limiar competitivo. De acordo com uma pesquisa recente da Economist Intelligence Unit, as empresas que usam tomada de decisões orientadas a dados desfrutam de um aumento de 5-6% na produtividade. No entanto, 53% das empresas usam apenas metade dos seus dados valiosos, e um quarto dos entrevistados notou que enormes quantidades de dados úteis vão sem acesso. Os volumes de dados são tão altos que a análise manual é impossível, e a maioria dos sistemas de software hereditário não pode manter-se, resultando em dados valiosos sendo descartados ou ignorados.

Com Big Data & Analytics’ software de big data de alta velocidade, escalável, os CSPs podem minar todos os seus dados para melhor tomada de decisão em menos tempo. Diferentes Big Data produtos e técnicas fornecem uma plataforma de software end-to-end para a recolha, preparação, análise e apresentação de insights de grandes dados. As áreas de aplicação incluem monitoramento de desempenho da rede, detecção de fraude, detecção de clientes e análise de risco de crédito. Big Data & Produtos de análise escala para lidar com terabytes de dados, mas a implementação dessas ferramentas requer um novo tipo de sistema de banco de dados baseado em nuvem como Hadoop ou processador de computação paralelo de escala massiva ( KPU etc.)

Este curso trabalha em Big Data BI para Telco cobre todas as novas áreas emergentes em que os CSPs estão investindo para aumentar a produtividade e abrir novos fluxos de receita de negócios. O curso fornecerá uma visão completa de 360 graus de Big Data BI em Telco para que os decisores e gerentes possam ter uma visão geral muito ampla e abrangente das possibilidades de Big Data BI em Telco para produtividade e ganho de receita.

Objetivos do curso

O objetivo principal do curso é introduzir novas Big Data técnicas de inteligência de negócios em 4 setores de Telecom Business (Marketing/Vendas, Operação de Rede, Operação Financeira e Relação com o Cliente Management). Os alunos serão introduzidos a seguir:

Introdução a Big Data-o que é 4Vs (volume, velocidade, variedade e veracidade) em Big Data- Geração, extração e gerenciamento da perspectiva da Telco
Como Big Data o analista difere do analista de dados de herança
In-house justificação de Big Data -Prospectiva Telco
Introdução a Hadoop Ecosistema- familiaridade com todas as Hadoop ferramentas como Hive, Pig, SPARC –quando e como eles são usados para resolver Big Data problema
Como Big Data é extraído para analisar para a ferramenta de análise-como Business Analysis’s podem reduzir seus pontos de dor de recolha e análise de dados através de uma abordagem integrada Hadoop dashboard
Introdução básica da análise de Insight, análise de visualização e análise preditiva para Telco
Analítica do cliente e Big Data-como Big Data analítica pode reduzir o cliente e a insatisfação do cliente em estudos de caso Telco
Análise de falhas de rede e de falhas de serviço a partir de metadados de rede e IPDR
Análise financeira-fraude, vazamento e estimativa do ROI a partir de dados de vendas e operações
Problemas de aquisição do cliente-Marketing Objetivo, Segmentação do cliente e Cross-Sales a partir de dados de vendas
Introdução e resumo de todos os Big Data produtos analíticos e onde eles se encaixam no espaço analítico da Telco
Conclusão-como tomar uma abordagem passo a passo para introduzir Big Data Business Intelligence em sua organização

Auditoria Objetiva

Operação de rede, gerentes financeiros, gerentes de CRM e gerentes de TI de alto nível no escritório do Telco CIO.
Business Analisadores em Telco
Diretores de escritório / analistas
Gestores Operacionais
Gerenciadores QA

Leia mais...

Apache Spark MLlib

35 Horas

O MLlib é a biblioteca de aprendizado de máquina (ML) do Spark. Seu objetivo é tornar prático o aprendizado de máquina escalável e fácil. Ele consiste em algoritmos e utilitários de aprendizado comuns, incluindo classificação, regressão, agrupamento, filtragem colaborativa, redução de dimensionalidade, além de primitivas de otimização de nível inferior e APIs de pipeline de nível superior.

Divide-se em dois pacotes:

O spark.mllib contém a API original construída sobre os RDDs.
O spark.ml fornece uma API de alto nível, construída sobre os DataFrames, para a construção de pipelines de ML.

Público

Este curso é direcionado a engenheiros e desenvolvedores que desejam utilizar uma biblioteca de máquinas integrada para o Apache Spark

Leia mais...

Data Science for Big Data Analytics

35 Horas

Big data é um conjunto de dados tão volumoso e complexo que os aplicativos tradicionais de processamento de dados são inadequados para lidar com eles. Os desafios do big data incluem a captura de dados, armazenamento de dados, análise de dados, pesquisa, compartilhamento, transferência, visualização, consulta, atualização e privacidade de informações.

Leia mais...

Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP

21 Horas

Este curso destina-se a programadores e cientistas de dados que pretendam compreender e implementar a IA nas suas aplicações. É dada especial atenção à análise de dados, à IA distribuída e ao processamento de linguagem natural.

Leia mais...

MATLAB Fundamentals, Data Science & Report Generation

35 Horas

Na primeira parte deste treinamento, abordamos os fundamentos de MATLAB e sua função como linguagem e plataforma. Incluída nesta discussão está uma introdução à sintaxe de MATLAB, matrizes e matrizes, visualização de dados, desenvolvimento de scripts e princípios orientados a objetos.

Na segunda parte, demonstramos como usar MATLAB para mineração de dados, aprendizado de máquina e análise preditiva. Para dar aos participantes uma perspetiva clara e prática da abordagem e do poder da MATLAB, estabelecemos comparações entre a utilização da MATLAB e a utilização de outras ferramentas, como folhas de cálculo, C, C++ e Visual Basic.

Na terceira parte da formação, os participantes aprendem a simplificar o seu trabalho, automatizando o processamento de dados e a criação de relatórios.

Ao longo do curso, os participantes colocarão em prática as ideias aprendidas através de exercícios práticos num ambiente de laboratório. No final da formação, os participantes terão um conhecimento profundo das capacidades de MATLAB e serão capazes de o empregar para resolver problemas reais de ciência de dados, bem como para agilizar o seu trabalho através da automatização.

As avaliações serão realizadas ao longo do curso para avaliar o progresso.

Formato do curso

O curso inclui exercícios teóricos e práticos, incluindo discussões de casos, inspeção de código de amostra e implementação prática.

Nota

As sessões práticas serão baseadas em modelos de relatório de dados de amostra pré-arranjados. Se tiver necessidades específicas, contacte-nos para combinarmos.

Leia mais...

Jupyter for Data Science Teams

7 Horas

Este treinamento ao vivo e ministrado por instrutor em Brasil (online ou presencial) introduz a ideia de desenvolvimento colaborativo em ciência de dados e demonstra como usar o Jupyter para acompanhar e participar, como uma equipe, no "ciclo de vida de uma ideia computacional". Ele guia os participantes através da criação de um projeto de ciência de dados baseado no ecossistema do Jupyter.

Ao final deste treinamento, os participantes serão capazes de:

Instalar e configurar o Jupyter, incluindo a criação e integração de um repositório de equipe no Git.
Usar recursos do Jupyter como extensões, widgets interativos, modo multiusuário e mais para habilitar colaboração em projetos.
Criar, compartilhar e organizar os Notebooks Jupyter com membros da equipe.
Esfolar de Scala, Python, R, para escrever e executar código contra sistemas de big data como Apache Spark, tudo através da interface do Jupyter.

Leia mais...

Introduction to Graph Computing

28 Horas

Neste treinamento ao vivo conduzido por instrutor em Brasil, os participantes aprenderão sobre as ofertas de tecnologia e abordagens de implementação para o processamento de dados gráficos. O objetivo é identificar objetos do mundo real, suas caraterísticas e relacionamentos, depois modelar esses relacionamentos e processá-los como dados usando uma abordagem Graph Computing (também conhecida como Graph Analytics). Começamos com uma visão geral e nos concentramos em ferramentas específicas à medida que avançamos em uma série de estudos de caso, exercícios práticos e implantações ao vivo.

No final deste treinamento, os participantes serão capazes de:

Entender como os dados do gráfico são persistidos e percorridos.
Selecionar a melhor estrutura para uma determinada tarefa (de bancos de dados de gráficos a estruturas de processamento em lote).
Implementar Hadoop, Spark, GraphX e Pregel para realizar a computação de gráficos em muitas máquinas em paralelo.
Ver problemas reais de grandes volumes de dados em termos de grafos, processos e travessias.

Leia mais...

Python Programming for Finance

35 Horas

Python é uma linguagem de programação que ganhou enorme popularidade no setor financeiro. Adotado pelos maiores bancos de investimento e fundos de hedge, ele está sendo usado para criar uma ampla gama de aplicações financeiras, que vão desde os principais programas de negociação até os sistemas de gerenciamento de riscos.

Neste treinamento ao vivo, ministrado por instrutor, os participantes aprenderão como usar o Python para desenvolver aplicativos práticos para resolver uma série de problemas específicos relacionados a finanças.

Ao final deste treinamento, os participantes serão capazes de:

Compreender os fundamentos da linguagem de programação Python
Baixar, instalar e manter as melhores ferramentas de desenvolvimento para criar aplicações financeiras em Python
Selecionar e utilizar os pacotes e técnicas de programação Python mais adequados para organizar, visualizar e analisar dados financeiros de diversas fontes (CSV, Excel, bancos de dados, web, etc.)
Construir aplicações que resolvam problemas relacionados à alocação de ativos, análise de riscos, desempenho de investimentos e muito mais
Solucionar problemas, integrar, implantar e otimizar uma aplicação Python

Público

Desenvolvedores
Analistas
Quants

Formato do curso

Parte palestra, parte discussão, exercícios e muita prática hands-on

Nota

Este treinamento tem como objetivo fornecer soluções para alguns dos principais problemas enfrentados por profissionais de finanças. No entanto, se você tiver um tópico, ferramenta ou técnica específica que deseja aprofundar ou elaborar, entre em contato conosco para combinar.

Leia mais...

Data Science essential for Marketing/Sales professionals

21 Horas

Este curso é destinado a Marketing Profissionais de Vendas que pretendem se aprofundar na aplicação da ciência de dados em Marketing/ Vendas. O curso fornece cobertura detalhada de diferentes técnicas de ciência de dados usadas para “upsale”, “venda cruzada”, segmentação de mercado, branding e CLV.

Diferença entre Marketing e Vendas - Como é que vendas e marketing são diferentes?

Em palavras muito simples, as vendas podem ser denominadas como um processo que se concentra ou visa indivíduos ou pequenos grupos. Marketing, por outro lado, tem como alvo um grupo maior ou o público em geral. Marketing inclui pesquisa (identificar as necessidades do cliente), desenvolvimento de produtos (produção de produtos inovadores) e promoção do produto (através de anúncios) e conscientizar os consumidores sobre o produto. Como tal, marketing significa gerar leads ou clientes potenciais. Uma vez que o produto é lançado no mercado, é tarefa do vendedor persuadir o cliente a comprar o produto. Vendas significa converter leads ou clientes potenciais em compras e pedidos, enquanto o marketing visa prazos mais longos, as vendas referem-se a metas mais curtas.

Leia mais...

Python e Spark para Big Data (PySpark)

21 Horas

Neste treinamento ao vivo conduzido por instrutor em Brasil, os participantes aprenderão como usar Python e Spark juntos para analisar big data enquanto trabalham em exercícios práticos.

Ao final deste treinamento, os participantes serão capazes de:

Aprenda a usar o Spark com Python para analisar Big Data.
Trabalhe em exercícios que imitam casos do mundo real.
Use diferentes ferramentas e técnicas para análise de big data usando PySpark.

Leia mais...

Anaconda Ecosystem for Data Scientists

14 Horas

Este treinamento ao vivo conduzido por instrutor em Brasil (no local ou remoto) é destinado a cientistas de dados que desejam usar o ecossistema Anaconda para capturar, gerenciar e implantar pacotes e fluxos de trabalho de análise de dados em uma única plataforma.

No final deste treinamento, os participantes serão capazes de:

Instalar e configurar componentes e bibliotecas Anaconda.
Compreender os principais conceitos, recursos e benefícios do Anaconda.
Gerenciar pacotes, ambientes e canais usando o Anaconda Navigator.
Usar pacotes Conda, R e Python para ciência de dados e aprendizado de máquina.
Conhecer alguns casos de uso práticos e técnicas para gerenciar vários ambientes de dados.

Leia mais...

GPU Data Science with NVIDIA RAPIDS

14 Horas

Este treinamento ao vivo conduzido por instrutor em Brasil (no local ou remoto) é destinado a cientistas de dados e desenvolvedores que desejam usar RAPIDS para construir pipelines de dados acelerados GPU, fluxos de trabalho e visualizações, aplicando algoritmos de aprendizado de máquina, como XGBoost, cuML, etc.

No final deste treinamento, os participantes serão capazes de:

Configurar o ambiente de desenvolvimento necessário para construir modelos de dados com a NVIDIA RAPIDS.
Compreender os recursos, componentes e vantagens de RAPIDS.
Aproveite GPU para acelerar os pipelines de dados e análises de ponta a ponta.
Implementar a preparação de dados acelerada por GPU e ETL com cuDF e Apache Arrow.
Aprenda a executar tarefas de aprendizado de máquina com os algoritmos XGBoost e cuML.
Crie visualizações de dados e execute análises de gráficos com cuXfilter e cuGraph.

Leia mais...

Accelerating Python Pandas Workflows with Modin

14 Horas

Este treinamento ao vivo conduzido por instrutor em Brasil (no local ou remoto) é destinado a cientistas e desenvolvedores de dados que desejam usar Modin para criar e implementar cálculos paralelos com Pandas para uma análise de dados mais rápida.

No final deste treinamento, os participantes serão capazes de:

Configurar o ambiente necessário para começar a desenvolver fluxos de trabalho Pandas em escala com Modin.
Compreender os recursos, a arquitetura e as vantagens de Modin.
Conhecer as diferenças entre Modin, Dask e Ray.
Realizar operações Pandas mais rapidamente com Modin.
Implementar toda a API Pandas e as funções.

Leia mais...

Kaggle

14 Horas

Este treinamento ao vivo conduzido por instrutor em Brasil (no local ou remoto) é destinado a cientistas de dados e desenvolvedores que desejam aprender e construir suas carreiras em Data Science usando Kaggle.

Ao final deste treinamento, os participantes serão capazes de:

Aprender sobre ciência de dados e aprendizado de máquina.
Explorar a análise de dados.
Aprender sobre Kaggle e como ele funciona.

Leia mais...

Stratio: Rocket and Intelligence Modules with PySpark

14 Horas

A Stratio é uma plataforma centrada em dados que integra big data, IA e governança em uma única solução. Seus módulos Rocket e Intelligence permitem a exploração rápida de dados, transformação e análises avançadas em ambientes empresariais.

Esta formação presencial (online ou no local), orientada por instrutor, é direcionada a profissionais de dados intermediários que desejam usar os módulos Rocket e Intelligence na Stratio efetivamente com PySpark, focando em estruturas de repetição, funções definidas pelo usuário e lógica de dados avançada.

Ao final deste treinamento, os participantes serão capazes de:

Navegar e trabalhar dentro da plataforma Stratio usando os módulos Rocket e Intelligence.
Aplicar PySpark no contexto de ingestão de dados, transformação e análise.
Usar loops e lógica condicional para controlar fluxos de trabalho de dados e tarefas de engenharia de recursos.
Criar e gerenciar funções definidas pelo usuário (UDFs) para operações reutilizáveis em PySpark.

Formato do Curso

Aula interativa e discussão.
Muitos exercícios e prática.
Implementação hands-on em um ambiente de laboratório ao vivo.

Opções de Personalização do Curso

Para solicitar uma formação personalizada para este curso, entre em contato conosco para agendar.

Leia mais...

Categorias Relacionadas

Curso de SMACK Stack for Data Science

Programa do Curso

Requisitos

Declaração de Clientes (1)

Richard Langford

Curso - SMACK Stack for Data Science

Próximas Formações Provisórias

SMACK Stack for Data Science

SMACK Stack for Data Science

SMACK Stack for Data Science

SMACK Stack for Data Science

Categorias Relacionadas

Este site em outros países/regiões

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites