Obrigado por enviar sua consulta! Um dos membros da nossa equipe entrará em contato com você em breve.
Obrigado por enviar sua reserva! Um dos membros da nossa equipe entrará em contato com você em breve.
Programa do Curso
Introdução à IA Multi-Modal
- O que é IA multi-modal?
- Desafios e aplicações principais
- Visão geral dos modelos multi-modais líderes
Processamento de Texto e Entendimento do Linguagem Natural
- Utilização de LLMs para agentes AI baseados em texto
- Compreensão da engenharia de prompts para tarefas multi-modais
- Afinamento de modelos textuais para aplicações específicas do domínio
Reconhecimento e Geração de Imagens
- Processamento de imagens com IA: classificação, descrição e detecção de objetos
- Geração de imagens com modelos de difusão (Stable Diffusion, DALLE)
- Integração de dados de imagem com modelos baseados em texto
Processamento de Voz e Áudio
- Reconhecimento de voz com Whisper ASR
- Técnicas de síntese de fala (TTS)
- Melhoria da interação do usuário com IA baseada em voz
Integração de Entradas Multi-Modais
- Construção de pipelines AI para processar vários tipos de entrada
- Técnicas de fusão para combinar dados de texto, imagem e voz
- Aplicações do mundo real dos agentes de IA multi-modais
Implantação de Agentes AI Multi-Modais
- Construção de soluções AI multi-modais baseadas em API
- Otimização de modelos para desempenho e escalabilidade
- Melhores práticas para implantar IA multi-modal em produção
Considerações Éticas e Tendências Futuras
- Viés e equidade na IA multi-modal
- Preocupações de privacidade com dados multi-modais
- Desenvolvimentos futuros na IA multi-modal
Resumo e Próximos Passos
Requisitos
- Compreensão dos fundamentos de aprendizado de máquina
- Experiência com programação em Python
- Familiaridade com frameworks de aprendizado profundo (por exemplo, TensorFlow, PyTorch)
Público-alvo
- Desenvolvedores de IA
- Pesquisadores
- Engenheiros multimídia
21 Horas
Declaração de Clientes (1)
Treinador respondendo perguntas na hora.
Adrian
Curso - Agentic AI Unleashed: Crafting LLM Applications with AutoGen
Máquina Traduzida