Obrigado por enviar sua consulta! Um dos membros da nossa equipe entrará em contato com você em breve.
Obrigado por enviar sua reserva! Um dos membros da nossa equipe entrará em contato com você em breve.
Programa do Curso
Fundamentos da Classificação de Áudio
- Tipos de eventos sonoros: ambientais, mecânicos, gerados por humanos
- Panorama dos casos de uso: vigilância, monitoramento, automação
- Classificação de áudio versus detecção versus segmentação
Dados de Áudio e Extração de Características
- Tipos de arquivos de áudio e formatos
- Considerações sobre taxa de amostragem, janelamento e tamanho do frame
- Extração de MFCCs, características cromáticas e mel-espectrogramas
Preparação dos Dados e Anotação
- UrbanSound8K, ESC-50 e conjuntos de dados personalizados
- Anotação de eventos sonoros e limites temporais
- Balanceamento de conjuntos de dados e aumento de áudio
Criando Modelos de Classificação de Áudio
- Uso de redes neurais convolucionais (CNNs) para áudio
- Entrada do modelo: forma de onda bruta versus características
- Funções de perda, métricas de avaliação e overfitting
Detecção de Eventos e Localização Temporal
- Estratégias de detecção baseadas em frames e segmentos
- Pós-processamento das detecções usando limiares e suavização
- Visualização das previsões nas linhas do tempo de áudio
Tópicos Avançados e Processamento em Tempo Real
- Aprendizado por transferência para cenários com poucos dados
- Implantação de modelos com TensorFlow Lite ou ONNX
- Processamento de áudio em streaming e considerações sobre latência
Desenvolvimento do Projeto e Cenários de Aplicação
- Projeto de um pipeline completo: da ingestão à classificação
- Desenvolvimento de um conceito comprovado para vigilância, controle de qualidade ou monitoramento
- Log, alerta e integração com painéis ou APIs
Resumo e Próximos Passos
Requisitos
- Conhecimento dos conceitos de aprendizado de máquina e treinamento de modelos
- Experiência com programação em Python e pré-processamento de dados
- Conhecimento básico sobre fundamentos do áudio digital
Público-Alvo
- Cientistas de dados
- Engenheiros de aprendizado de máquina
- Pesquisadores e desenvolvedores em processamento de sinais de áudio
21 Horas