Entrar em Contato

Programa do Curso

Fundamentos da Classificação de Áudio

  • Tipos de eventos sonoros: ambientais, mecânicos, gerados por humanos
  • Panorama dos casos de uso: vigilância, monitoramento, automação
  • Classificação de áudio versus detecção versus segmentação

Dados de Áudio e Extração de Características

  • Tipos de arquivos de áudio e formatos
  • Considerações sobre taxa de amostragem, janelamento e tamanho do frame
  • Extração de MFCCs, características cromáticas e mel-espectrogramas

Preparação dos Dados e Anotação

  • UrbanSound8K, ESC-50 e conjuntos de dados personalizados
  • Anotação de eventos sonoros e limites temporais
  • Balanceamento de conjuntos de dados e aumento de áudio

Criando Modelos de Classificação de Áudio

  • Uso de redes neurais convolucionais (CNNs) para áudio
  • Entrada do modelo: forma de onda bruta versus características
  • Funções de perda, métricas de avaliação e overfitting

Detecção de Eventos e Localização Temporal

  • Estratégias de detecção baseadas em frames e segmentos
  • Pós-processamento das detecções usando limiares e suavização
  • Visualização das previsões nas linhas do tempo de áudio

Tópicos Avançados e Processamento em Tempo Real

  • Aprendizado por transferência para cenários com poucos dados
  • Implantação de modelos com TensorFlow Lite ou ONNX
  • Processamento de áudio em streaming e considerações sobre latência

Desenvolvimento do Projeto e Cenários de Aplicação

  • Projeto de um pipeline completo: da ingestão à classificação
  • Desenvolvimento de um conceito comprovado para vigilância, controle de qualidade ou monitoramento
  • Log, alerta e integração com painéis ou APIs

Resumo e Próximos Passos

Requisitos

  • Conhecimento dos conceitos de aprendizado de máquina e treinamento de modelos
  • Experiência com programação em Python e pré-processamento de dados
  • Conhecimento básico sobre fundamentos do áudio digital

Público-Alvo

  • Cientistas de dados
  • Engenheiros de aprendizado de máquina
  • Pesquisadores e desenvolvedores em processamento de sinais de áudio
 21 Horas

Número de participantes


Preço por participante

Próximas Formações Provisórias

Categorias Relacionadas