План на курса
Първи ден: Основи на езика
- Въведение в курса
-
За анализа на данни
- Дефиниция за анализ на данни
- Процесът на извършване на анализ на данни.
- Въведение в езика R
- Променливи и типове
- Управлени структури (цикли / условни изрази)
-
Скалари, вектори и матрици на R
- Дефиниране на вектори в R
- Матрици
-
Работа с низове и текст
- Тип данни char
- Файлови операции във външни файлове (IO)
- Списания
-
Функции
- Въведение в функциите
- Затваряне (closures)
- lapply/sapply функции
- DataFrames
- Лабораторни упражнения за всички секции
Втори ден: Средно ниво на програмиране с R
- DataFrames и файлови операции (I/O)
- Четене на данни от файлове
- Подготовка на данните
- Вградени набори данни
-
Визуализация
- Графики пакет
- plot() / barplot() / hist() / boxplot() / scatter plot
- Теплови карти (Heat Map)
- Пакет ggplot2 (qplot(), ggplot())
- Експлорация с Dplyr
- Лабораторни упражнения за всички секции
Трети ден: Напредък в програмирането с R
-
Статистически модели с R
- Статистически функции
- Работа с NA
- Разпределения (биномно, пуассоново, нормално)
-
Регресия
- Въведение в линейната регресия
- Препоръки
- Обработка на текст (пакет tm / облаци от думи)
-
Кластериране
- Въведение в кластерирането
- KMeans
-
Класификация
- Въведение в класификацията
- Наивен Байес (Naive Bayes)
- Дървени модели на вземане на решения (Decision Trees)
- Обучение с пакет caret
- Оценка на алгоритми
-
R и големи данни (Big Data)
- Свързване на R с бази данни
- Екосистема на големите данни (Big Data Ecosystem)
- Лабораторни упражнения за всички секции
Изисквания
- Потребителите трябва да имат основна подготовка по програмиране
Подготовка
- Современен ноутбук
- Последна версия на R Studio и R среда инсталирани
Отзиви от потребители (7)
Реалните приложения в живота, използвайки примерите със Statcan и CER.
Matthew - Natural Resources Canada
Курс - Data Analytics With R
Машинен превод
Знанието му и кодовете бяха вече написани в файловете, така че могах да ги изучавам след уроците и да се упражнявам самостоятелно.
GLORIA ADANNE - Natural Resources Canada
Курс - Data Analytics With R
Машинен превод
Много код на R и добри примери
Kasia - Natural Resources Canada
Курс - Data Analytics With R
Машинен превод
Разширена езикова подкрепа и добре разработена. Също така има богато количество допълнителна информация, налична онлайн.
Michel - Natural Resources Canada
Курс - Data Analytics With R
Машинен превод
Ми ми хареса, че преподавателят се уверяваше, че всички разбираме и следваме лекциите. Ако имахме проблем, той спираше и ни помагаше да го решим.
Cesar - AMERICAN EXPRESS COMPANY MEXICO
Курс - Data Analytics With R
Машинен превод
The tool was interesting and I see the use. I would like to learn about more about it.
- Teleperformance
Курс - Data Analytics With R
Машинен превод
New tool which is “R” and I find it interesting to know the existence of such tool for data analysis.
Michael Lopez - Teleperformance
Курс - Data Analytics With R
Машинен превод