План на курса

Първи ден

  1. Введение в R & Rstudio (2 часа)
    • Направяне на R по-приятен, R и наличните графични интерфейси
    • Rstudio
    • Скриптване в Rstudio
    • Навигация, секции и скъсяване на код
    • Диагностика и отстраняване на грешки в RStudio
    • Свързани софтуерни приложения и документация
    • Получаване на помощ с функции и функции
    • Проекти в RStudio
    • Създаване на анализни отчета с RStudio
    • Клавишни преки пътища и полезни функции
  2. Внасяне/изнасяне на данни (1 час)
    • Плоски файлове – txt, csv
    • Електронни таблици – xls, xlsx
    • Данни от формат SPSS, SAS и други
    • Accessане на данни от SQL източници на данни
    • SQL връзка с бази данни и операции
  3. Организиране на данни (2 часа)
    • Типове данни и класове
    • Съхранение на данни в R – формат Rdata
    • Структура на обектите
    • Числа и вектори
    • Matrix и таблица
    • Фактори
    • Списъци
    • Данни рамки
    • Дата и час
  4. Таблично представяне (3 часа)
    • Обзор на пакети за таблични данни – dplyr, tidyr, data.table
    • Индекси и подскрипти
    • Избиране, подмножества на наблюдения и променливи
    • Филтриране, групиране
    • Прекодиране на трансформации
    • Преобразуване на данни
    • Сливане на данни
    • Манипулиране на нишки, пакет stringr
    • Регулярни изрази

Втори ден

  1. Свързани софтуерни приложения и документация (1 час)
    • Rstudio и GIT - версия
    • Markdown
    • Отчет и представяне с LaTeX
    • Shiny уеб приложения
  2. R и Statistics (2 часа)
    • Вероятност и нормално разпределение
    • Случайни числа
    • Описваща Statistics
    • Стандартизация и нормализация
    • Интервали на доверие
    • Тестване на хипотези
    • ANOVA
    • Квалитативен анализ на данни
  3. Линейна регресия (2 часа)
    • Коефициент на корелация и интерпретация
    • Еднофакторна и мултифакторна линейна регресия
    • Методи за оценка – наименьшие квадрати
    • Валидиране на модели – тестове за нарушаване на предположения
    • Избор на променливи – различни подходи
    • Регуляризация – линейна и лассо регресия
    • Обобщена наименьшая квадратна – нелинейност
    • Логистична регресия
  4. Графични процедури (2 часа)
    • Основни графики за 1 променлива
    • Визуализация за 2 и повече променливи
    • Графични параметри
    • Специални графики
    • Експортиране на графики във файлове png, pdf и jpeg
    • Разширяване на графичните възможности на R с ggplot2
  5. Помощ в R (1 час)
    • Търсене в документацията на R
    • R пакети и документация
    • R Cran Task View – търсене на решение на проблем

Изисквания

За този курс не са необходими специални предварителни знания.

 14 часа

Брой участници


Цена за участник

Отзиви от потребители (1)

Предстоящи Курсове

Свързани Kатегории