Programa do Curso

Introdução

  • O que são Large Language Models (LLMs)?
  • LLMs vs modelos tradicionais de PNL
  • Panorâmica das características e da arquitetura das LLMs
  • Desafios e limitações das LLMs

Compreender os LLM

  • O ciclo de vida de um LLM
  • Como funcionam as LLM
  • Os principais componentes de uma LLM: codificador, descodificador, atenção, embeddings, etc.

Começar a trabalhar

  • Configurar o ambiente de desenvolvimento
  • Instalação de um LLM como ferramenta de desenvolvimento, por exemplo, Google Colab, Hugging Face

Trabalhar com LLMs

  • Explorar as opções de LLM disponíveis
  • Criar e utilizar um LLM
  • Afinar um LLM num conjunto de dados personalizado

Sumarização de texto

  • Compreender a tarefa de sumarização de texto e as suas aplicações
  • Utilizar um LLM para a sumarização extractiva e abstractiva de textos
  • Avaliar a qualidade dos resumos gerados usando métricas como ROUGE, BLEU, etc.

Resposta a perguntas

  • Compreender a tarefa de responder a perguntas e as suas aplicações
  • Utilizar um LLM para responder a perguntas de domínio aberto e de domínio fechado
  • Avaliar a exatidão das respostas geradas utilizando métricas como F1, EM, etc.

Geração de texto

  • Compreender a tarefa de geração de texto e as suas aplicações
  • Utilizar uma LLM para a geração de textos condicionais e incondicionais
  • Controlar o estilo, o tom e o conteúdo dos textos gerados utilizando parâmetros como a temperatura, top-k, top-p, etc.

Integrar os LLM com outros quadros e plataformas

  • Usando LLMs com PyTorch ou TensorFlow
  • Usando LLMs com Flask ou Streamlit
  • Usando LLMs com Google Cloud ou AWS

Resolução de problemas

  • Compreender os erros e bugs comuns em LLMs
  • Utilizar o TensorBoard para monitorizar e visualizar o processo de formação
  • Utilização do PyTorch Lightning para simplificar o código de treino e melhorar o desempenho
  • Utilizar o Hugging Face Datasets para carregar e pré-processar os dados

Resumo e próximas etapas

Requisitos

    Conhecimento do processamento de linguagem natural e da aprendizagem profunda Experiência com Python e PyTorch ou TensorFlow Experiência básica de programação

Público

    Programadores Entusiastas de PNL Cientistas de dados
 14 horas

Número de participantes



Preço por participante

Cursos Relacionados

Categorias Relacionadas