Obrigado por enviar sua consulta! Um dos membros da nossa equipe entrará em contato com você em breve.
Obrigado por enviar sua reserva! Um dos membros da nossa equipe entrará em contato com você em breve.
Programa do Curso
Designando uma Arquitetura Aberta AIOps
- Visão geral dos componentes-chave em pipelines abertos AIOps
- Fluxo de dados do processo de coleta até o alerta
- Comparação e estratégia de integração de ferramentas
Coleta e Agregação de Dados
- Coletando dados em série temporal com Prometheus
- Capturando logs com Logstash e Beats
- Normalizando os dados para correlação interfonte
Construindo Painéis de Observabilidade
- Visualizando métricas com Grafana
- Criando painéis Kibana para análise de logs
- Usando consultas Elasticsearch para extrair insights operacionais
Detecção de Anomalias e Previsão de Incidentes
- Exportando dados de observabilidade para pipelines Python
- Treinamento de modelos ML para detecção de outliers e previsão
- Deploying models for live inference in the observability pipeline
Alerta Automatizado e Automação com Ferramentas Abertas
- Criando regras de alerta Prometheus e roteamento do Alertmanager
- Acionando scripts ou fluxos de trabalho da API para resposta automática
- Usando ferramentas de orquestração open-source (por exemplo, Ansible, Rundeck)
Considerações sobre Integração e Escalabilidade
- Lidando com alta ingestão de volume e retenção a longo prazo
- Segurança e controle de acesso em pilhas open-source
- Escalando cada camada independentemente: coleta, processamento, alerta
Aplicações no Mundo Real e Extensões
- Estudos de caso: otimização de desempenho, prevenção de tempo inativo e otimização de custos
- Extendendo pipelines com ferramentas de rastreamento ou gráficos de serviços
- Práticas recomendadas para execução e manutenção do AIOps em produção
Resumo e Próximos Passos
Requisitos
- Experiência com ferramentas de observabilidade como Prometheus ou ELK
- Conhecimento prático de Python e fundamentos de aprendizado de máquina
- Compreensão das operações de TI e fluxos de trabalho de alertas
Público-alvo
- Engenheiros avançados de confiabilidade do site (SREs)
- Engenheiros de dados atuando em operações
- Líderes de plataforma DevOps e arquitetos de infraestrutura
14 Horas