Programa do Curso
I. Introdução e preliminares
1. Panorâmica geral
- Tornar o R mais amigável, R e GUIs disponíveis
- Rstudio
- Software e documentação relacionados
- R e estatística
- Utilização interactiva do R
- Uma sessão introdutória
- Obter ajuda com funções e caraterísticas
- Comandos do R, sensibilidade às maiúsculas e minúsculas, etc.
- Recuperação e correção de comandos anteriores
- Execução de comandos a partir de um ficheiro ou desvio da saída para um ficheiro
- Permanência de dados e remoção de objectos
- Prática de programação Go: Scripts autónomos, boa legibilidade, por exemplo, scripts estruturados, documentação, markdown
- Instalação de pacotes; CRAN e Bioconductor
2. Ler dados
- Ficheiros Txt (read.delim)
- Ficheiros CSV
3. Manipulações simples; números e vectores + matrizes
- Vectores e atribuição
- Aritmética de vectores
- Geração de sequências regulares
- Vectores lógicos
- Valores em falta
- Vectores de caracteres
- Vectores de índice; seleção e modificação de subconjuntos de um conjunto de dados
- Matrizes
- Indexação de matrizes. Subsecções de uma matriz
- Matrizes de índice
- A função array() + operações simples em matrizes, por exemplo, multiplicação, transposição
- Outros tipos de objectos
4. Listas e quadros de dados
- Listas
- Construção e modificação de listas
- Concatenação de listas
- Estruturas de dados
- Criar quadros de dados
- Trabalhar com quadros de dados
- Anexar listas arbitrárias
- Gerir o caminho de pesquisa
5. Manipulação de dados
- Seleção, subconjunto de observações e variáveis
- Filtragem, agrupamento
- Recodificação, transformações
- Agregação, combinação de conjuntos de dados
- Formação de matrizes particionadas, cbind() e rbind()
- A função de concatenação, (), com arrays
- Manipulação de caracteres, pacote stringr
- breve introdução ao grep e ao regexpr
6. Mais sobre a leitura de dados
- Ficheiros XLS, XLSX
- pacotes readr e readxl
- SPSS, SAS, Stata,... e outros formatos de dados
- Exportação de dados para txt, csv e outros formatos
6. Agrupamento, loops e execução condicional
- Expressões agrupadas
- Instruções de controlo
- Execução condicional: instruções if
- Execução repetitiva: loops for, repeat e while
- introdução a apply, lapply, sapply, tapply
7. Funções
- Criar funções
- Argumentos opcionais e valores por defeito
- Número variável de argumentos
- Âmbito e suas consequências
8. Gráficos simples em R
- Criar um gráfico
- Gráficos de densidade
- Gráficos de pontos
- Gráficos de barras
- Gráficos de linhas
- Gráficos de pizza
- Boxplots
- Gráficos de dispersão
- Combinação de gráficos
II. Análise estatística em R
1. Distribuições de probabilidade
- O R como um conjunto de tabelas estatísticas
- Examinar a distribuição de um conjunto de dados
2. Teste de hipóteses
- Testes sobre a média de uma população
- Teste do rácio de verosimilhança
- Testes com uma e duas amostras
- Teste do Qui-Quadrado Go de adequação
- Estatística de uma amostra de Kolmogorov-Smirnov
- Teste de Wilcoxon de postos sinalizados
- Teste de duas amostras
- Teste de soma de postos de Wilcoxon
- Teste de Mann-Whitney
- Teste de Kolmogorov-Smirnov
3. Testes múltiplos de hipóteses
- Erro de tipo I e FDR
- Curvas ROC e AUC
- Procedimentos de testes múltiplos (BH, Bonferroni, etc.)
4. Modelos de regressão linear
- Funções genéricas para extração de informação de modelos
- Atualização de modelos ajustados
- Modelos lineares generalizados
- Famílias
- A função glm()
- Classificação
- Regressão logística
- Análise discriminante linear
- Aprendizagem não supervisionada
- Análise de componentes principais
- Métodos de agrupamento (k-means, agrupamento hierárquico, k-medoids)
5. Análise de sobrevivência (pacote de sobrevivência)
- Objectos de sobrevivência no r
- Estimativa Kaplan-Meier, teste log-rank, regressão paramétrica
- Bandas de confiança
- Análise de dados censurados (censurados por intervalo)
- Modelos PH de Cox, covariáveis constantes
- Modelos de Cox PH, covariáveis dependentes do tempo
- Simulação: Comparação de modelos (Comparação de modelos de regressão)
6. Análise de variância
- ANOVA unidirecional
- Classificação de ANOVA de duas vias
- MANOVA
III. Problemas práticos em bioinformática
- Breve introdução ao pacote limma
- Fluxo de trabalho de análise de dados de microarray
- Descarregamento de dados do GEO: https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1397
- Processamento de dados (controlo de qualidade, normalização, expressão diferencial)
- Gráfico de vulcão
- Exemplos de agrupamento + mapas de calor
Declaração de Clientes (5)
como o instrutor demonstra seu conhecimento sobre o assunto que está ensinando
john ernesto ii fernandez - Philippine AXA Life Insurance Corporation
Curso - Data Vault: Building a Scalable Data Warehouse
Máquina Traduzida
Muito útil porque ajuda a entender o que podemos fazer com os dados no nosso contexto. Também vai me auxiliar
Nicolas NEMORIN - Adecco Groupe France
Curso - KNIME Analytics Platform for BI
Máquina Traduzida
Eu realmente gostei dos exercícios de passos práticos.
Yunfa Zhu - Environmental and Climate Change Canada
Curso - Foundation R
Máquina Traduzida
O ritmo foi perfeito e a atmosfera relaxada fez os candidatos se sentirem à vontade para fazer perguntas.
Rhian Hughes - Public Health Wales NHS Trust
Curso - Introduction to Data Visualization with Tidyverse and R
Máquina Traduzida
Richard's training style kept it interesting, the real world examples used helped to drive the concepts home.
Jamie Martin-Royle - NBrown Group
Curso - From Data to Decision with Big Data and Predictive Analytics
Máquina Traduzida