Obrigado por enviar sua consulta! Um dos membros da nossa equipe entrará em contato com você em breve.
Obrigado por enviar sua reserva! Um dos membros da nossa equipe entrará em contato com você em breve.
Programa do Curso
Fundamentos da Classificação de Áudio
- Tipo de eventos sonoros: ambiental, mecânico, gerado por humanos
- Visão geral de casos de uso: vigilância, monitoramento, automação
- Classificação de áudio versus detecção versus segmentação
Dados de Áudio e Extração de Características
- Tipos de arquivos de áudio e formatos
- Taxa de amostragem, janelamento, considerações sobre o tamanho do quadro
- Extração de MFCCs, características cromáticas, mel-espectrogramas
Preparação dos Dados e Anotação
- UrbanSound8K, ESC-50 e conjuntos de dados personalizados
- Anotação de eventos sonoros e limites temporais
- Balanço dos conjuntos de dados e aumento do áudio
Criação de Modelos de Classificação de Áudio
- Uso de redes neurais convolucionais (CNNs) para áudio
- Entrada do modelo: onda sonora bruta versus características
- Funções de perda, métricas de avaliação e sobreajuste
Deteção de Eventos e Localização Temporal
- Estratégias de detecção baseadas em quadros e segmentos
- Pós-processamento de detecções usando limiares e suavização
- Visualização das previsões no cronograma do áudio
Tópicos Avançados e Processamento em Tempo Real
- Aprendizagem transferida para cenários com poucos dados
- Implantação de modelos com TensorFlow Lite ou ONNX
- Processamento de áudio em streaming e considerações sobre latência
Desenvolvimento do Projeto e Cenários de Aplicação
- Diseño de uma pipeline completa: ingestão à classificação
- Desenvolvimento de conceitos-piloto para vigilância, controle de qualidade ou monitoramento
- Registros, alertas e integração com painéis ou APIs
Resumo e Próximos Passos
Requisitos
- Compreensão dos conceitos de aprendizado de máquina e treinamento de modelos
- Experiência com programação Python e pré-processamento de dados
- Familiaridade com fundamentos de áudio digital
Público-alvo
- Cientistas de dados
- Engenheiros de aprendizado de máquina
- pesquisadores e desenvolvedores em processamento de sinais de áudio
21 Horas