План на курса
I. Въведение и предварителна информация
1. Преглед
- Правене на R по-приятелски, R и достъпни GUI
- Rstudio
- Свързан софтуер и документация
- R и статистика
- Използване на R интерактивно
- Въвеждаща сесия
- Получаване на помощ за функции и функции
- R команди, чувствителност към главни и малки букви и др.
- Припомняне и коригиране на предишни команди
- Изпълнение на команди от или пренасочване на изход към файл
- Постоянност на данните и премахване на обекти
- Good практика на програмиране: Самостоятелни скриптове, добра четливост, напр. структурирани скриптове, документация, маркиране
- инсталиране на пакети; CRAN и Bioпроводник
2. Четене на данни
- Txt файлове (read.delim)
- CSV файлове
3. Прости манипулации; числа и вектори + масиви
- Вектори и задание
- Векторна аритметика
- Генериране на регулярни последователности
- Логически вектори
- Липсващи стойности
- Символни вектори
- Индексни вектори; избиране и модифициране на подмножества от набор от данни
- Масиви
- Индексиране на масиви. Подсекции на масив
- Индексни матрици
- Функцията array() + прости операции върху масиви, напр. умножение, транспониране
- Други видове обекти
4. Списъци и рамки с данни
- Списъци
- Конструиране и модифициране на списъци
- Конкатениране на списъци
- Рамки за данни
- Изработване на рамки за данни
- Работа с рамки от данни
- Прикачване на произволни списъци
- Управление на пътя за търсене
5. Манипулиране на данни
- Избор, подмножество наблюдения и променливи
- Филтриране, групиране
- Прекодиране, трансформации
- Агрегиране, комбиниране на масиви от данни
- Формиране на разделени матрици, cbind() и rbind()
- Функцията за конкатенация, (), с масиви
- Манипулиране на знаци, пакет stringr
- кратко въведение в grep и regexpr
6. Повече за четене на данни
- XLS, XLSX файлове
- readr и readxl пакети
- SPSS, SAS, Stata,… и други формати на данни
- Експортиране на данни в txt, csv и други формати
6. Групиране, цикли и условно изпълнение
- Групирани изрази
- Контролни отчети
- Условно изпълнение: оператори if
- Повтарящо се изпълнение: за цикли, повторение и докато
- въведение в apply, lapply, sapply, tappply
7. Функции
- Създаване на функции
- Незадължителни аргументи и стойности по подразбиране
- Променлив брой аргументи
- Обхват и последствията от него
8. Проста графика в R
- Създаване на графика
- Графики за плътност
- Точкови графики
- Бар Парцели
- Линейни графики
- Кръгови диаграми
- Boxplots
- Точкови графики
- Комбиниране на сюжети
II. Статистически анализ в R
1. Вероятностни разпределения
- R като набор от статистически таблици
- Изследване на разпространението на набор от данни
2. Тестване на хипотези
- Тестове за средна стойност на населението
- Тест за коефициент на вероятност
- Едно- и двупробни тестове
- Хи-квадрат Goтест за съгласуваност
- Едноизвадкова статистика на Колмогоров-Смирнов
- Тест за знаков ранг на Wilcoxon
- Тест с две проби
- Тест за сума на ранг на Уилкоксън
- Тест на Ман-Уитни
- Тест на Колмогоров-Смирнов
3. Многократно тестване на хипотези
- Тип I грешка и FDR
- ROC криви и AUC
- Множество процедури за тестване (BH, Bonferroni и др.)
4. Линейни регресионни модели
- Генерични функции за извличане на информация за модела
- Актуализиране на вталените модели
- Обобщени линейни модели
- Семейства
- Функцията glm().
- Класификация
- Логистична регресия
- Линеен дискриминантен анализ
- Учене без надзор
- Анализ на основните компоненти
- Методи за групиране (k-средни, йерархично групиране, k-medoids)
5. Анализ на оцеляването (пакет за оцеляване)
- Обекти за оцеляване в r
- Оценка на Каплан-Майер, log-rank тест, параметрична регресия
- Ленти за доверие
- Анализ на цензурирани (интервално цензурирани) данни
- Cox PH модели, постоянни ковариати
- Cox PH модели, зависими от времето ковариати
- Симулация: Сравнение на модели (Сравняване на регресионни модели)
6. Анализ на дисперсията
- Еднопосочна ANOVA
- Двупосочна класификация на ANOVA
- МАНОВА
III. Работени задачи по биоинформатика
- Кратко въведение в пакета limma
- Работен процес за анализ на данни от микрочипове
- Изтегляне на данни от GEO: https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1397
- Обработка на данни (QC, нормализация, диференциално изразяване)
- Сюжет за вулкан
- Примери за Custering + топлинни карти
Отзиви от потребители (5)
Денят 1 и Денят 2 бяха много лесни за мен и наистина се забавях по време на това изживяване.
Mareca Sithole - Africa Health Research Institute
Курс - R Fundamentals
Машинен превод
Искрено се насладих на упражненията, които бяха проведени.
Yunfa Zhu - Environmental and Climate Change Canada
Курс - Foundation R
Машинен превод
Темпото беше точно съответно, а спокойната атмосфера прави кандидатите да се чувстват комфортно при задаването на въпроси.
Rhian Hughes - Public Health Wales NHS Trust
Курс - Introduction to Data Visualization with Tidyverse and R
Машинен превод
въпросът беше добре представен и по методичен начин.
Marylin Houle - Ivanhoe Cambridge
Курс - Introduction to R with Time Series Analysis
Машинен превод
Michael the trainer is very knowledgeable and skillful about the subject of Big Data and R. He is very flexible and quickly customize the training meeting clients' need. He is also very capable to solve technical and subject matter problems on the go. Fantastic and professional training!.
Xiaoyuan Geng - Ottawa Research and Development Center, Science Technology Branch, Agriculture and Agri-Food Canada
Курс - Programming with Big Data in R
Машинен превод