Curso de Jupyter para Equipes de Ciência de Dados
O Jupyter é um IDE interativo e um ambiente de computação de código aberto, baseado na Web.
Este treinamento ao vivo conduzido por instrutor (no local ou remoto) apresenta a ideia de desenvolvimento colaborativo em ciência de dados e demonstra como usar o Jupyter para rastrear e participar como uma equipe no "ciclo de vida de uma ideia computacional". Ele conduz os participantes através da criação de um projeto de ciência de dados de amostra baseado no topo do ecossistema Jupyter.
No final deste treinamento, os participantes serão capazes de:
- Instalar e configurar o Jupyter, incluindo a criação e integração de um repositório de equipa no Git.
- Usar os recursos do Jupyter, como extensões, widgets interativos, modo multiusuário e muito mais para permitir a colaboração no projeto.
- Criar, partilhar e organizar Jupyter Notebooks com os membros da equipa.
- Escolher entre Scala, Python, R, para escrever e executar código contra sistemas de big data como Apache Spark, tudo através da interface Jupyter.
Formato do curso
- Palestra interactiva e discussão.
- Muitos exercícios e prática.
- Implementação prática num ambiente de laboratório ao vivo.
Opções de personalização do curso
- O Jupyter Notebook suporta mais de 40 idiomas, incluindo R, Python, Scala, Julia, etc. Para personalizar este curso para a(s) sua(s) língua(s) de eleição, por favor contacte-nos para combinar.
Programa do Curso
Introdução ao Jupyter
- Visão geral do Jupyter e do seu ecossistema
- Instalação e configuração
- Configurar o Jupyter para colaboração em equipa
Funcionalidades de colaboração
- Utilização do Git para controlo de versões
- Extensões e widgets interactivos
- Modo multiutilizador
Criar e gerir blocos de notas
- Estrutura e funcionalidade dos blocos de notas
- Partilhar e organizar blocos de notas
- Melhores práticas de colaboração
Programming com o Jupyter
- Escolher e utilizar linguagens de programação (Python, R, Scala)
- Escrever e executar código
- Integração com sistemas de grandes volumes de dados (Apache Spark)
Recursos avançados do Jupyter
- Personalização do ambiente Jupyter
- Automatizando fluxos de trabalho com o Jupyter
- Explorando casos de uso avançados
Sessões práticas
- Laboratórios práticos
- Projectos de ciência de dados do mundo real
- Exercícios de grupo e revisões por pares
Resumo e próximos passos
Requisitos
- Experiência Programming em linguagens como Python, R, Scala, etc.
- Experiência em ciência de dados
Público
- Equipas de ciência de dados
Os cursos de treinamento abertos exigem mais de 5 participantes.
Curso de Jupyter para Equipes de Ciência de Dados - Reserva
Curso de Jupyter para Equipes de Ciência de Dados - Consulta
Jupyter para Equipes de Ciência de Dados - SOLICITAÇÃO DE CONSULTORIA
Testemunhos de Clientes (1)
É ótimo ter o curso personalizado para as áreas-chave que destaquei no questionário pré-curso. Isso realmente ajuda a abordar as perguntas que tenho sobre o assunto e alinhar com meus objetivos de aprendizagem.
Winnie Chan - Statistics Canada
Curso - Jupyter for Data Science Teams
Máquina Traduzida
Próximas Formações Provisórias
Cursos Relacionados
Introdução à Ciência de Dados e IA usando Python
35 HorasExplora abordagens práticas para a Ciência de Dados e IA utilizando Python — capacita profissionais com as competências necessárias para explorar dados, construir modelos de machine learning e implementar aplicações de IA em contextos empresariais; Aborda fluxos de trabalho CRISP-DM, análise estatística, aprendizado supervisionado e não supervisionado, deep learning com Tensorflow, processamento de linguagem natural, big data com Spark e narrativa impulsionada por dados; Ideal para iniciantes que procuram certificação em ciência de dados com Python e formação em análise de dados pronta para o mercado.
Automatizando Machine Learning Pipelines
21 HorasEste treinamento presencial, liderado por instrutores em Brasil (online ou no local) é voltado para participantes de nível intermediário que desejam automatizar e gerenciar fluxos de trabalho de aprendizado de máquina, incluindo o treinamento, a validação e a implantação de modelos usando Apache Airflow.
Ao final deste treinamento, os participantes serão capazes de:
- Configurar o Apache Airflow para orquestração de fluxos de trabalho de aprendizado de máquina.
- Automatizar tarefas de pré-processamento de dados, treinamento e validação de modelos.
- Integrar o Airflow com frameworks e ferramentas de aprendizado de máquina.
- Implantar modelos de aprendizado de máquina usando pipelines automatizados.
- Monitorar e otimizar fluxos de trabalho de aprendizado de máquina em produção.
Ecosystem para Cientistas de Dados
14 HorasEste treinamento ao vivo conduzido por instrutor em Brasil (no local ou remoto) é destinado a cientistas de dados que desejam usar o ecossistema Anaconda para capturar, gerenciar e implantar pacotes e fluxos de trabalho de análise de dados em uma única plataforma.
No final deste treinamento, os participantes serão capazes de:
- Instalar e configurar componentes e bibliotecas Anaconda.
- Compreender os principais conceitos, recursos e benefícios do Anaconda.
- Gerenciar pacotes, ambientes e canais usando o Anaconda Navigator.
- Usar pacotes Conda, R e Python para ciência de dados e aprendizado de máquina.
- Conhecer alguns casos de uso práticos e técnicas para gerenciar vários ambientes de dados.
AWS Cloud9 para Data Science
28 HorasEste treinamento conduzido por um instrutor, realizado ao vivo em Brasil (online ou presencial), é voltado para cientistas de dados e analistas de nível intermediário que desejam usar o AWS Cloud9 para fluxos de trabalho de ciência de dados otimizados.
Ao final deste treinamento, os participantes serão capazes de:
- Configurar um ambiente de ciência de dados no AWS Cloud9.
- Realizar análise de dados usando Python, R e Jupyter Notebook no Cloud9.
- Integrar o AWS Cloud9 com serviços de dados da AWS, como S3, RDS e Redshift.
- Utilizar o AWS Cloud9 para desenvolvimento e implantação de modelos de machine learning.
- Otimizar fluxos de trabalho baseados em nuvem para análise e processamento de dados.
Introdução ao Google Colab para Ciência de Dados
14 HorasEste treinamento orientado por instrutor em Brasil (online ou presencial) é direcionado a cientistas de dados iniciantes e profissionais de TI que desejam aprender os fundamentos da ciência de dados usando o Google Colab.
Ao final deste treinamento, os participantes serão capazes de:
- Configurar e navegar no Google Colab.
- Escrever e executar código Python básico.
- Importar e manipular conjuntos de dados.
- Criar visualizações usando bibliotecas Python.
Ciência de Dados essencial para profissionais de Marketing/Vendas
21 HorasEste curso é destinado a Profissionais de Marketing e Vendas que pretendem se aprofundar na aplicação da ciência de dados no Marketing/Vendas. O curso oferece cobertura detalhada das diferentes técnicas de ciência de dados usadas para "up-sale", "cross-sale", segmentação de mercado, branding e CLV.
Diferença entre Marketing e Vendas - Como as vendas e o marketing são diferentes?
Em palavras muito simples, vendas podem ser definidas como um processo que se concentra ou visa indivíduos ou pequenos grupos. Por outro lado, o marketing visa um grupo maior ou o público em geral. O marketing inclui pesquisa (identificação das necessidades do cliente), desenvolvimento de produtos (produção de produtos inovadores) e promoção do produto (através de publicidade) e criação de conscientização sobre o produto entre os consumidores. Portanto, o marketing significa gerar leads ou prospects. Uma vez que o produto está no mercado, é tarefa do vendedor convencer o cliente a comprar o produto. As vendas significam converter leads ou prospects em compras e pedidos, enquanto o marketing visa objetivos de longo prazo, as vendas se referem a metas de curto prazo.
Kaggle
14 HorasEste treinamento ao vivo conduzido por instrutor em Brasil (no local ou remoto) é destinado a cientistas de dados e desenvolvedores que desejam aprender e construir suas carreiras em Data Science usando Kaggle.
Ao final deste treinamento, os participantes serão capazes de:
- Aprender sobre ciência de dados e aprendizado de máquina.
- Explorar a análise de dados.
- Aprender sobre Kaggle e como ele funciona.
Ciência de Dados com a Plataforma KNIME Analytics
21 HorasA Plataforma KNIME Analytics é uma das principais opções open source para inovação baseada em dados, ajudando você a descobrir o potencial oculto nos seus dados, minerar por novos insights ou prever futuros possíveis. Com mais de 1000 módulos, centenas de exemplos prontos para execução, uma ampla gama de ferramentas integradas e a maior variedade de algoritmos avançados disponíveis, a Plataforma KNIME Analytics é o conjunto perfeito de ferramentas para qualquer cientista de dados e analista de negócios.
Este curso para a Plataforma KNIME Analytics é uma oportunidade ideal para iniciantes, usuários avançados e especialistas em KNIME serem introduzidos ao KNIME, aprenderem a usá-lo de forma mais eficaz e criar relatórios claros e abrangentes com base em fluxos de trabalho do KNIME.
Este treinamento guiado por instrutor (online ou presencial) é voltado para profissionais de dados que desejam usar o KNIME para resolver necessidades complexas de negócios.
É destinado a um público que não conhece programação e pretende usar ferramentas avançadas para implementar cenários analíticos.
Ao final deste treinamento, os participantes serão capazes de:
- Instalar e configurar o KNIME.
- Criar cenários de Ciência de Dados
- Treinar, testar e validar modelos
- Implementar a cadeia de valor completa dos modelos de ciência de dados
Formato do Curso
- Aula interativa e discussão.
- Muitos exercícios e prática.
- Implementação hands-on em um ambiente de laboratório ao vivo.
Opções de Customização do Curso
- Para solicitar um treinamento personalizado para este curso ou para obter mais informações sobre o programa, entre em contato conosco para agendar.
Machine Learning para Data Science com Python
21 HorasEsta formação ao vivo, ministrada por um instrutor em Brasil (online ou presencial), é direcionada a analistas de dados intermediários, desenvolvedores ou cientistas de dados aspirantes que desejam aplicar técnicas de aprendizado de máquina no Python para extrair insights, fazer previsões e automatizar decisões baseadas em dados.
No final deste curso, os participantes serão capazes de:
- Compreender e diferenciar os principais paradigmas de aprendizado de máquina.
- Explorar técnicas de pré-processamento de dados e métricas de avaliação de modelos.
- Aplicar algoritmos de aprendizado de máquina para resolver problemas reais com dados.
- Utilizar bibliotecas do Python e Jupyter notebooks para desenvolvimento prático.
- Criar modelos para previsão, classificação, recomendação e agrupamento.
Introdução a Modelos Pré-treinados
14 HorasEste treinamento ao vivo conduzido por instrutor em Brasil (no local ou remoto) é destinado a profissionais de nível iniciante que desejam entender o conceito de modelos pré-treinados e aprender como aplicá-los para resolver problemas do mundo real sem construir modelos do zero.
No final deste treinamento, os participantes serão capazes de:
- Compreender o conceito e os benefícios dos modelos pré-treinados.
- Explore várias arquiteturas de modelo pré-treinadas e seus casos de uso.
- Ajuste fino de um modelo pré-treinado para tarefas específicas.
- Implementar modelos pré-treinados em projetos simples de aprendizado de máquina.
Programação Python para Finanças
35 HorasO Python é uma linguagem de programação que ganhou enorme popularidade na indústria financeira. Adotada pelos maiores bancos de investimento e fundos hedge, ela está sendo usada para construir uma ampla gama de aplicações financeiras, desde programas de negociação principais até sistemas de gerenciamento de riscos.
Neste treinamento ministrado por um instrutor ao vivo, os participantes aprenderão a usar o Python para desenvolver aplicações práticas que resolvem uma série de problemas financeiros específicos.
Ao final deste treinamento, os participantes serão capazes de:
- Compreender os fundamentos da linguagem de programação Python
- Baixar, instalar e manter as melhores ferramentas de desenvolvimento para criar aplicações financeiras em Python
- Selecionar e utilizar os pacotes Python mais adequados e técnicas de programação para organizar, visualizar e analisar dados financeiros provenientes de várias fontes (CSV, Excel, bancos de dados, web, etc.)
- Criar aplicações que resolvem problemas relacionados a alocação de ativos, análise de riscos, desempenho dos investimentos e mais
- Solucionar problemas, integrar, implantar e otimizar uma aplicação Python
Público-alvo
- Desenvolvedores
- Analistas
- Quants
Formato do curso
- Parte aula, parte discussão, exercícios e muita prática hands-on
Nota
- Este treinamento visa fornecer soluções para alguns dos principais problemas enfrentados por profissionais financeiros. No entanto, se você tiver um tópico, ferramenta ou técnica específica que deseja adicionar ou aprofundar mais, entre em contato conosco para arranjar.
Ciência de Dados com GPU usando NVIDIA RAPIDS
14 HorasEste treinamento presencial, ministrado pelo instrutor em Brasil (online ou localmente), é destinado a cientistas de dados e desenvolvedores que desejam usar o RAPIDS para construir pipelines de dados aceleradas por GPU, fluxos de trabalho e visualizações, aplicando algoritmos de aprendizado de máquina, como XGBoost, cuML, etc.
Ao final deste treinamento, os participantes serão capazes de:
- Configurar o ambiente de desenvolvimento necessário para criar modelos de dados com NVIDIA RAPIDS.
- Compreender as funcionalidades, componentes e vantagens do RAPIDS.
- Utilizar GPUs para acelerar pipelines de dados e análise de ponta a ponta.
- Implementar a preparação de dados e ETL acelerados por GPU com cuDF e Apache Arrow.
- Aprender como realizar tarefas de aprendizado de máquina com algoritmos XGBoost e cuML.
- Construir visualizações de dados e executar análise de gráficos com cuXfilter e cuGraph.