Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Programa do Curso
Introdução
- O que são Large Language Models (LLMs)?
- LLMs vs modelos tradicionais de PNL
- Panorâmica das características e da arquitetura das LLMs
- Desafios e limitações das LLMs
Compreender os LLM
- O ciclo de vida de um LLM
- Como funcionam as LLM
- Os principais componentes de uma LLM: codificador, descodificador, atenção, embeddings, etc.
Começar a trabalhar
- Configurar o ambiente de desenvolvimento
- Instalação de um LLM como ferramenta de desenvolvimento, por exemplo, Google Colab, Hugging Face
Trabalhar com LLMs
- Explorar as opções de LLM disponíveis
- Criar e utilizar um LLM
- Afinar um LLM num conjunto de dados personalizado
Sumarização de texto
- Compreender a tarefa de sumarização de texto e as suas aplicações
- Utilizar um LLM para a sumarização extractiva e abstractiva de textos
- Avaliar a qualidade dos resumos gerados usando métricas como ROUGE, BLEU, etc.
Resposta a perguntas
- Compreender a tarefa de responder a perguntas e as suas aplicações
- Utilizar um LLM para responder a perguntas de domínio aberto e de domínio fechado
- Avaliar a exatidão das respostas geradas utilizando métricas como F1, EM, etc.
Geração de texto
- Compreender a tarefa de geração de texto e as suas aplicações
- Utilizar uma LLM para a geração de textos condicionais e incondicionais
- Controlar o estilo, o tom e o conteúdo dos textos gerados utilizando parâmetros como a temperatura, top-k, top-p, etc.
Integrar os LLM com outros quadros e plataformas
- Usando LLMs com PyTorch ou TensorFlow
- Usando LLMs com Flask ou Streamlit
- Usando LLMs com Google Cloud ou AWS
Resolução de problemas
- Compreender os erros e bugs comuns em LLMs
- Utilizar o TensorBoard para monitorizar e visualizar o processo de formação
- Utilização do PyTorch Lightning para simplificar o código de treino e melhorar o desempenho
- Utilizar o Hugging Face Datasets para carregar e pré-processar os dados
Resumo e próximas etapas
Requisitos
-
Conhecimento do processamento de linguagem natural e da aprendizagem profunda
Experiência com Python e PyTorch ou TensorFlow
Experiência básica de programação
Público
-
Programadores
Entusiastas de PNL
Cientistas de dados
14 horas