Programa do Curso

Introdução a Speech Recognition e Síntese

  • Fundamentos das tecnologias da fala
  • Noções básicas de sistemas de reconhecimento de fala
  • Visão geral da síntese da fala

Papel das LLMs nas tecnologias da fala

  • Compreender as LLMs no reconhecimento do discurso
  • LLMs em síntese de fala
  • Vantagens dos LLMs em relação aos modelos tradicionais

Dados para Speech Recognition e síntese

  • Recolha e processamento de dados para as tecnologias da fala
  • Conjuntos de dados de treino para LLMs
  • Considerações éticas no tratamento de dados

Treinar LLMs para aplicações de fala

  • Técnicas de aprendizagem profunda no reconhecimento do discurso
  • Arquitecturas de redes neuronais para síntese da fala
  • Ajuste fino de LLMs para tarefas específicas de fala

Implementação de LLMs em sistemas de fala

  • Integração de LLMs com motores de reconhecimento de fala
  • Desenvolvimento de sintetizadores de fala com som natural
  • Conceção da interface do utilizador para aplicações de fala

Teste e avaliação de sistemas de fala

  • Métodos para testar a exatidão do reconhecimento de voz
  • Avaliação da naturalidade da fala sintetizada
  • Estudos de utilizadores e recolha de feedback

Desafios e soluções em tecnologias da fala

  • Abordar problemas comuns no reconhecimento de voz
  • Ultrapassar obstáculos na síntese do discurso
  • Estudos de casos: implementações bem sucedidas de LLMs

Direcções futuras em tecnologias da fala

  • Tendências emergentes no reconhecimento e síntese do discurso
  • O papel dos LLMs nos sistemas de fala multilingues
  • Inovações e oportunidades de investigação

Projeto e avaliação

  • Conceção e implementação de um sistema de reconhecimento ou síntese da fala utilizando LLMs
  • Avaliações pelos pares e discussões em grupo
  • Avaliação final e feedback

Resumo e próximos passos

Requisitos

  • Compreensão dos conceitos básicos de programação
  • Recomenda-se, mas não se exige, experiência com programação Python
  • A familiaridade com conceitos básicos de aprendizagem automática e de redes neurais é benéfica

Público-alvo

  • Programadores de software
  • Cientistas de dados
  • Gerentes de produto
 14 horas

Número de participantes



Preço por participante

Cursos Relacionados

Categorias Relacionadas