Programa do Curso

Introdução à Inteligência Artificial Multimodal

  • Visão geral da inteligência artificial multimodal e aplicações no mundo real
  • Desafios na integração de dados textuais, imagens e áudio
  • Pesquisas e avanços mais recentes

Processamento de Dados e Engenharia de Recursos

  • Manipulação de conjuntos de dados textuais, imagens e áudio
  • Técnicas de pré-processamento para aprendizado multimodal
  • Estratégias de extração de recursos e fusão de dados

Construindo Modelos Multimodais com PyTorch e Hugging Face

  • Introdução ao PyTorch para aprendizado multimodal
  • Usando Transformers do Hugging Face para tarefas de processamento de linguagem natural (NLP) e visão computacional
  • Combinando diferentes modalidades em um modelo AI unificado

Implementação da Fusão de Áudio, Visão e Texto

  • Integração do OpenAI Whisper para reconhecimento de fala
  • Aplicando DeepSeek-Vision para processamento de imagens
  • Técnicas de fusão para aprendizado cross-modal

Treinamento e Otimização de Modelos Multimodais AI

  • Estratégias de treinamento de modelos para IA multimodal
  • Técnicas de otimização e ajuste de hiperparâmetros
  • Lidando com vieses e melhorando a generalização do modelo

Implementação de IA Multimodal em Aplicações Reais

  • Exportação de modelos para uso em produção
  • Implantação de modelos AI em plataformas na nuvem
  • Monitoramento de desempenho e manutenção do modelo

Tópicos Avançados e Tendências Futuras

  • Aprendizado zero-shot e few-shot na IA multimodal
  • Considerações éticas e desenvolvimento responsável de AI
  • Tendências emergentes na pesquisa de IA multimodal

Resumo e Próximos Passos

Requisitos

  • Comprensão sólida dos conceitos de aprendizado de máquina e aprendizado profundo
  • Experiência com frameworks de IA como PyTorch ou TensorFlow
  • Familiaridade com o processamento de dados de texto, imagem e áudio

Público-alvo

  • Desenvolvedores de IA
  • Engenheiros de aprendizado de máquina
  • Pesquisadores
 21 Horas

Número de participantes


Preço por Participante

Próximas Formações Provisórias

Categorias Relacionadas