План на курса

Първи ден: Основи на езика

  • Въведение в курса
  • За анализа на данни
    • Дефиниция за анализ на данни
    • Процесът на извършване на анализ на данни.
  • Въведение в езика R
  • Променливи и типове
  • Управлени структури (цикли / условни изрази)
  • Скалари, вектори и матрици на R
    • Дефиниране на вектори в R
    • Матрици
  • Работа с низове и текст
    • Тип данни char
    • Файлови операции във външни файлове (IO)
  • Списания
  • Функции
    • Въведение в функциите
    • Затваряне (closures)
    • lapply/sapply функции
  • DataFrames
  • Лабораторни упражнения за всички секции

Втори ден: Средно ниво на програмиране с R

  • DataFrames и файлови операции (I/O)
  • Четене на данни от файлове
  • Подготовка на данните
  • Вградени набори данни
  • Визуализация
    • Графики пакет
    • plot() / barplot() / hist() / boxplot() / scatter plot
    • Теплови карти (Heat Map)
    • Пакет ggplot2 (qplot(), ggplot())
  • Експлорация с Dplyr
  • Лабораторни упражнения за всички секции

Трети ден: Напредък в програмирането с R

  • Статистически модели с R
    • Статистически функции
    • Работа с NA
    • Разпределения (биномно, пуассоново, нормално)
  • Регресия
    • Въведение в линейната регресия
  • Препоръки
  • Обработка на текст (пакет tm / облаци от думи)
  • Кластериране
    • Въведение в кластерирането
    • KMeans
  • Класификация
    • Въведение в класификацията
    • Наивен Байес (Naive Bayes)
    • Дървени модели на вземане на решения (Decision Trees)
    • Обучение с пакет caret
    • Оценка на алгоритми
  • R и големи данни (Big Data)
    • Свързване на R с бази данни
    • Екосистема на големите данни (Big Data Ecosystem)
  • Лабораторни упражнения за всички секции

Изисквания

  • Потребителите трябва да имат основна подготовка по програмиране

Подготовка

  • Современен ноутбук
  • Последна версия на R Studio и R среда инсталирани
 21 часа

Брой участници


Цена за участник

Отзиви от потребители (7)

Предстоящи Курсове

Свързани Kатегории