Obrigado por enviar sua consulta! Um dos membros da nossa equipe entrará em contato com você em breve.
Obrigado por enviar sua reserva! Um dos membros da nossa equipe entrará em contato com você em breve.
Programa do Curso
Introdução a Multimodal AI
- Panorama da IA multimodal e das aplicações no mundo real
- Desafios na integração de dados de texto, imagem e áudio
- Investigação e avanços no estado da arte
Processamento de dados e engenharia de caraterísticas
- Tratamento de conjuntos de dados de texto, imagem e áudio
- Técnicas de pré-processamento para aprendizagem multimodal
- Estratégias de extração de caraterísticas e fusão de dados
Construção de modelos multimodais com PyTorch e Hugging Face
- Introdução ao PyTorch para aprendizagem multimodal
- Utilização de Hugging Face Transformers para tarefas de PNL e visão
- Combinação de diferentes modalidades num modelo de IA unificado
Implementação da fusão de fala, visão e texto
- Integração do OpenAI Whisper para reconhecimento do discurso
- Aplicação do DeepSeek-Vision ao processamento de imagens
- Técnicas de fusão para aprendizagem multimodal
Formação e otimização de modelos Multimodal AI
- Estratégias de formação de modelos para IA multimodal
- Técnicas de otimização e afinação de hiperparâmetros
- Abordar a distorção e melhorar a generalização do modelo
Implementação de Multimodal AI em aplicações do mundo real
- Exportação de modelos para utilização na produção
- Implantação de modelos de IA em plataformas de nuvem
- Monitorização do desempenho e manutenção do modelo
Tópicos avançados e tendências futuras
- Aprendizagem zero-shot e few-shot em IA multimodal
- Considerações éticas e desenvolvimento responsável da IA
- Tendências emergentes na investigação de IA multimodal
Resumo e próximos passos
Requisitos
- Forte conhecimento dos conceitos de aprendizagem automática e aprendizagem profunda
- Experiência com quadros de IA como PyTorch ou TensorFlow
- Familiaridade com processamento de dados de texto, imagem e áudio
Público
- Programadores de IA
- Engenheiros de aprendizagem automática
- Investigadores
21 Horas