Programa do Curso

Designando uma Arquitetura Aberta AIOps

  • Visão geral dos componentes-chave em pipelines abertos AIOps
  • Fluxo de dados do processo de coleta até o alerta
  • Comparação e estratégia de integração de ferramentas

Coleta e Agregação de Dados

  • Coletando dados em série temporal com Prometheus
  • Capturando logs com Logstash e Beats
  • Normalizando os dados para correlação interfonte

Construindo Painéis de Observabilidade

  • Visualizando métricas com Grafana
  • Criando painéis Kibana para análise de logs
  • Usando consultas Elasticsearch para extrair insights operacionais

Detecção de Anomalias e Previsão de Incidentes

  • Exportando dados de observabilidade para pipelines Python
  • Treinamento de modelos ML para detecção de outliers e previsão
  • Deploying models for live inference in the observability pipeline

Alerta Automatizado e Automação com Ferramentas Abertas

  • Criando regras de alerta Prometheus e roteamento do Alertmanager
  • Acionando scripts ou fluxos de trabalho da API para resposta automática
  • Usando ferramentas de orquestração open-source (por exemplo, Ansible, Rundeck)

Considerações sobre Integração e Escalabilidade

  • Lidando com alta ingestão de volume e retenção a longo prazo
  • Segurança e controle de acesso em pilhas open-source
  • Escalando cada camada independentemente: coleta, processamento, alerta

Aplicações no Mundo Real e Extensões

  • Estudos de caso: otimização de desempenho, prevenção de tempo inativo e otimização de custos
  • Extendendo pipelines com ferramentas de rastreamento ou gráficos de serviços
  • Práticas recomendadas para execução e manutenção do AIOps em produção

Resumo e Próximos Passos

Requisitos

  • Experiência com ferramentas de observabilidade como Prometheus ou ELK
  • Conhecimento prático de Python e fundamentos de aprendizado de máquina
  • Compreensão das operações de TI e fluxos de trabalho de alertas

Público-alvo

  • Engenheiros avançados de confiabilidade do site (SREs)
  • Engenheiros de dados atuando em operações
  • Líderes de plataforma DevOps e arquitetos de infraestrutura
 14 Horas

Número de participantes


Preço por Participante

Próximas Formações Provisórias

Categorias Relacionadas