Obrigado por enviar sua consulta! Um dos membros da nossa equipe entrará em contato com você em breve.
Obrigado por enviar sua reserva! Um dos membros da nossa equipe entrará em contato com você em breve.
Programa do Curso
Introdução ao AIOps
- O que é AIOps e por que ele importa
- Monitoramento tradicional vs. observabilidade impulsionada por AIOps
- Arquitetura de AIOps e componentes principais
Coleta e Normalização de Dados Operacionais
- Tipos de dados de observabilidade: métricas, logs e rastreamentos
- Ingestão de dados de múltiplas fontes (servidores, contêineres, nuvem)
- Uso de agentes e exportadores (Prometheus, Beats, Fluentd)
Correlação de Dados e Detecção de Anomalias
- Correlação de séries temporais e métodos estatísticos
- Uso de modelos de ML para detecção de anomalias
- Detecção de incidentes em sistemas distribuídos
Alertas e Redução de Ruído
- Design de regras e limites inteligentes de alerta
- Supressão, deduplicação e agrupamento de alertas
- Integração com Alertmanager, Slack, PagerDuty ou Opsgenie
Análise de Causa Raiz e Visualização
- Uso de painéis para visualizar métricas e detectar tendências
- Exploração de eventos e linhas do tempo para RCA (Análise de Causa Raiz)
- Rastreamento de problemas em camadas com ferramentas de rastreamento distribuído
Automação e Remediação
- Disparo de scripts ou fluxos de trabalho automatizados a partir de incidentes
- Integração com sistemas ITSM (ServiceNow, Jira)
- Casos de uso: autogerenciamento, escalonamento, rerotação de tráfego
Plataformas AIOps Open Source e Comerciais
- Visão geral das ferramentas: Prometheus, Grafana, ELK, Moogsoft, Dynatrace
- Critérios de avaliação para selecionar uma plataforma AIOps
- Demonstração e hands-on com uma pilha selecionada
Resumo e Próximos Passos
Requisitos
- Compreensão dos conceitos de operações de TI e monitoramento de sistemas
- Experiência com ferramentas ou painéis de monitoramento
- Familiaridade com formatos básicos de logs e métricas
Público-Alvo
- Equipes de operações responsáveis por infraestrutura e aplicativos
- Engenheiros de Confiabilidade do Site (SREs)
- Equipes de monitoramento e observabilidade de TI
14 Horas