Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Programa do Curso
Esboço detalhado do treinamento
- Introdução à PNL Compreendendo PNL Frameworks de PNL Aplicações comerciais de PNL Extração de dados da web Trabalhando com várias APIs para recuperar dados de texto Trabalhando e armazenando corpora de texto salvando conteúdo e metadados relevantes Vantagens de usar curso intensivo de Python e NLTK Compreensão prática de um corpus e conjunto de dados Por que precisamos de um corpus? Análise de Corpus Tipos de atributos de dados Diferentes formatos de arquivo para corpora Preparando um conjunto de dados para aplicações de PNL Compreendendo a estrutura de uma frase Componentes da PNL Compreensão de linguagem natural Análise morfológica - radical, palavra, token, tags de fala Análise sintática Análise semântica Tratamento de ambiguidade Pré-processamento de dados de texto Corpus - texto bruto Tokenização de sentenças Stemming para texto bruto Lemização de texto bruto Remoção de palavras de interrupção Frases brutas de Corpus Word tokenização Word lematização Trabalhando com matrizes Termo-Documento/Documento-Termo Tokenização de texto em n-gramas e sentenças Pré-processamento prático e personalizado Analisando dados de texto Recurso básico de analisadores de PNL e análise de tags e taggers de POS Reconhecimento de entidade de nome N-gramas Saco de palavras Recursos estatísticos de PNL Conceitos de álgebra linear para PNL Teoria probabilística para PNL Codificadores e decodificadores de vetorização TF-IDF Normalização Modelos probabilísticos Engenharia avançada de recursos e PNL Noções básicas de word2vec Componentes do modelo word2vec Lógica do modelo word2vec Extensão do conceito word2vec Aplicação do modelo word2vec Estudo de caso: Aplicação de saco de palavras: resumo automático de texto usando algoritmos de Luhn simplificados e verdadeiros Agrupamento de documentos, classificação e modelagem de tópicos Agrupamento de documentos e mineração de padrões (agrupamento hierárquico, k-means, clustering, etc.) Comparação e classificação de documentos usando TFIDF, Jaccard e medidas de distância cosseno Classificação de documentos usando Naïve Bayes e Entropia Máxima Identificação de Elementos de Texto Importantes Redução de dimensionalidade: Análise de Componentes Principais, Decomposição de Valores Singulares fatoração de matriz não negativa Modelagem de tópicos e recuperação de informações usando análise semântica latente, extração de entidades, análise de sentimento e modelagem avançada de tópicos Positivo vs. negativo: grau de sentimento Teoria de resposta ao item Marcação de partes do discurso e sua aplicação: encontrar pessoas, lugares e organizações mencionadas em texto Modelagem avançada de tópicos: Alocação de Dirichlet Latente Estudos de caso Mineração de análises de usuários não estruturadas Classificação de sentimento e visualização de revisão de produto Logs de pesquisa de mineração de dados para padrões de uso Classificação de texto Modelagem de tópico
Requisitos
Conhecimento e sensibilização para os princípios da PNL e apreciação da aplicação da IA na atividade empresarial
21 horas
Declaração de Clientes (2)
Good conceptual explanations followed by good example exercises
Appu Hannadi Thotahewage Eranga De Silva - University of New South Wales, Sydney
Curso - ROS: Programming for Robotics
Exercícios e sessões de perguntas e respostas
Antoine - Physiobotic
Curso - Scaling Data Pipelines with Spark NLP
Machine Translated