План на курса

I. Въведение и предварителна информация

1. Преглед

    Правене на R по-приятелски, R и достъпни графични потребителски интерфейси Rstudio Свързан софтуер и документация R и статистика Използване на R интерактивно Въвеждаща сесия Получаване на помощ за функции и функции R команди, чувствителност към главни и малки букви и т.н. Извикване и коригиране на предишни команди Изпълнение на команди от или пренасочване на изход към файл Постоянност на данните и премахване на обекти Goот практиката на програмиране: Самостоятелни скриптове, добра четливост, напр. структурирани скриптове, документация, пакети за инсталиране с маркиране; CRAN и Bioconductor

2. Четене на данни

    Txt файлове (read.delim) CSV файлове

3. Прости манипулации; числа и вектори + масиви

    Вектори и присвояване Векторна аритметика Генериране на правилни последователности Логически вектори Липсващи стойности Символни вектори Индексни вектори; избор и модифициране на подмножества от набор от данни Масиви
Индексиране на масиви. Подсекции на масив
  • Индексни матрици
  • Функцията array() + прости операции върху масиви, напр. умножение, транспониране
  • Други видове обекти
  • 4. Списъци и рамки с данни
  • Списъци Конструиране и модифициране на списъци Конкатениране на списъци

      Data frames Изработка на data frames
    Работа с рамки от данни
  • Прикачване на произволни списъци
  • Управление на пътя за търсене
  • 5. Манипулиране на данни
  • Избор, подмножество наблюдения и променливи Филтриране, групиране Прекодиране, трансформации Агрегиране, комбиниране на набори от данни Формиране на разделени матрици, cbind() и rbind() Функцията за конкатенация, (), с масиви Манипулиране на знаци, stringr пакет кратко въведение в grep и regexpr
  • 6. Повече за четене на данни

      XLS, XLSX файлове readr и readxl пакети SPSS, SAS, Stata,… и други формати данни Експортиране на данни в txt, csv и други формати

    6. Групиране, цикли и условно изпълнение

      Групирани изрази Контролни оператори Условно изпълнение: if оператори Повтарящо се изпълнение: for цикли, repeat и while въведение в apply, lapply, sapply, tapply

    7. Функции

      Създаване на функции Незадължителни аргументи и стойности по подразбиране Променлив брой аргументи Обхват и последствията от него

    8. Проста графика в R

      Създаване на графика Плътност Графики Точкови графики Стълбовидни графики Линейни диаграми Кръгови диаграми Графики с кутии Точкови графики Комбиниращи графики

    II. Статистически анализ в R

      1. Вероятностни разпределения

    R като набор от статистически таблици Изследване на разпределението на набор от данни

    2. Тестване на хипотези

      Тестове за съотношението на съотношението на средната популация на вероятността Тест с една и две извадки Тест Хи-квадрат Goодност на съответствието Тест на Колмогоров-Смирнов Статистика с една извадка Wilcoxon Signed-Rank Test Тест с две извадки Wilcoxon Rank Sum Test Mann-Whitney Тест Колмогоров-Смирнов Тест

    3. Многократно тестване на хипотези

      Грешка тип I и FDR ROC криви и AUC Процедури за множество тестове (BH, Bonferroni и др.)

    4. Линейни регресионни модели

      Генерични функции за извличане на информация за модел Актуализиране на монтирани модели Обобщени линейни модели Семейства Функцията glm()

    Класификация Логистична регресия

      Линеен дискриминантен анализ
    Анализ на основните компоненти на обучение без надзор
  • Методи за групиране (k-средни, йерархично групиране, k-medoids)
  • 5. Анализ на оцеляването (пакет за оцеляване)
  • Обекти за оцеляване в r Оценка на Kaplan-Meier, log-rank тест, параметрична регресия Доверителни ленти Цензуриран (интервал цензуриран) анализ на данни Модели на Cox PH, постоянни ковариати Модели на Cox PH, зависими от времето ковариати Симулация: Сравнение на модели (Сравняване на регресионни модели)
  • 6. Анализ на дисперсията
  • Еднопосочна ANOVA Двупосочна класификация на ANOVA MANOVA
  • III. Работени задачи по биоинформатика

      Кратко въведение в пакета limma Работен поток за анализ на данни с микрочипове Изтегляне на данни от GEO: https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1397 Обработка на данни (QC, нормализация, диференциално изразяване) График на вулкан Примери за Custering + топлинни карти
     28 Hours

    Брой участници



    Цена за участник

    Oтзиви от потребители (8)

    Свързани Kурсове

    Knowledge Discovery in Databases (KDD)

    21 Hours

    Introduction to Data Visualization with Tidyverse and R

    7 Hours

    From Data to Decision with Big Data and Predictive Analytics

    21 Hours

    Свързани Kатегории