Programa do Curso

Machine Learning Introdução

  • Tipos de aprendizado de máquina – supervisionado vs não supervisionado
  • Do aprendizado estatístico ao aprendizado de máquina
  • O fluxo de trabalho da mineração de dados: compreensão do negócio, preparação dos dados, modelagem, implantação
  • Escolhendo o algoritmo certo para a tarefa
  • Sobreajuste e o trade-off entre viés e variância

Python e Visão Geral de Bibliotecas de ML

  • Por que usar linguagens de programação para ML
  • Escolhendo entre R e Python
  • Breve introdução ao Python e Jupyter Notebooks
  • Bibliotecas do Python: pandas, NumPy, scikit-learn, matplotlib, seaborn

Testando e Avaliando Algoritmos de ML

  • Generalização, sobreajuste e validação do modelo
  • Estratégias de avaliação: holdout, cross-validation, bootstrapping
  • Métricas para regressão: ME, MSE, RMSE, MAPE
  • Métricas para classificação: acurácia, matriz de confusão, classes desbalanceadas
  • Visualização do desempenho do modelo: curva de lucro, curva ROC, curva lift
  • Seleção e busca em grade para ajuste do modelo

Preparação dos Dados

  • Importação e armazenamento de dados no Python
  • Análise exploratória e estatísticas descritivas
  • Lidando com valores ausentes e outliers
  • Padrão, normalização e transformação
  • Codificação de dados qualitativos e manipulação de dados com pandas

Algoritmos de Classificação

  • Classificação binária vs multiclasse
  • Regressão logística e funções discriminantes
  • Naïve Bayes, k-vizinhos mais próximos
  • Árvores de decisão: CART, Random Forests, Bagging, Boosting, XGBoost
  • Máquinas de vetores de suporte e kernels
  • Técnicas de aprendizado em conjunto

Regressão e Previsão Numérica

  • Mínimos quadrados e seleção de variáveis
  • Métodos de regularização: L1, L2
  • Regressão polinomial e modelos não lineares
  • Árvores de regressão e splines

Neural Networks

  • Introdução a redes neurais e aprendizado profundo
  • Funções de ativação, camadas e retropropagação
  • Multilayer perceptrons (MLP)
  • Usando TensorFlow ou PyTorch para modelagem básica de redes neurais
  • Redes neurais para classificação e regressão

Vendas Forecasting e Predictive Analytics

  • Séries temporais vs previsão baseada em regressão
  • Lidando com dados sazonais e tendenciais
  • Criando um modelo de previsão de vendas usando técnicas de ML
  • Avaliando a precisão e incerteza das previsões
  • Business interpretação e comunicação dos resultados

Unsupervised Learning

  • Técnicas de agrupamento: k-means, k-medoids, clusterização hierárquica, SOMs
  • Redução de dimensionalidade: PCA, análise fatorial, SVD
  • Escala multidimensional

Mining de Texto

  • Pré-processamento e tokenização de texto
  • Bolsa de palavras, stemming e lematização
  • Análise de sentimento e frequência de palavras
  • Visualizando dados de texto com nuvens de palavras

Sistemas de Recomendação

  • Filtragem colaborativa baseada em usuários vs itens
  • Deseñando e avaliando motores de recomendação

Mineração de Padrões Associativos

  • Conjuntos frequentes e algoritmo Apriori
  • Análise do cesto de compras e razão lift

Deteção de Outliers

  • Análise de valores extremos
  • Métodos baseados em distância e densidade
  • Deteção de outliers em dados multidimensionais

Machine Learning Estudo de Caso

  • Compreendendo o problema do negócio
  • Pré-processamento dos dados e engenharia de características
  • Seleção do modelo e ajuste de parâmetros
  • Avaliação e apresentação das descobertas
  • Implantação

Resumo e Próximos Passos

Requisitos

  • Noções básicas de conceitos de aprendizado de máquina, como aprendizagem supervisionada e não supervisionada
  • Familiaridade com programação em Python (variáveis, loops, funções)
  • Alguma experiência com manipulação de dados usando bibliotecas como pandas ou NumPy é útil, mas não obrigatória
  • Não se espera experiência prévia com modelagem avançada ou redes neurais

Público-alvo

  • Cientistas de dados
  • Analistas Business
  • Engenheiros de software e profissionais técnicos que trabalham com dados
 28 Horas

Número de participantes


Preço por Participante

Declaração de Clientes (2)

Próximas Formações Provisórias

Categorias Relacionadas