Съдържание и теми, включени в курса
Въведение
- Преглед на характеристиките и архитектурата на Spark и Hadoop
- Разбиране на големите данни
- Основи на програмирането с Python
Първи стъпки
- Настройка на Python, Spark и Hadoop
- Разбиране на структурите от данни в Python
- Разбиране на PySpark API
- Разбиране на HDFS и MapReduce
Интегриране на Spark и Hadoop с Python
- Внедряване на Spark RDD в Python
- Обработка на данни с помощта на MapReduce
- Създаване на разпределени набори от данни в HDFS
Машинно обучение със Spark MLlib
Обработка на големи данни със Spark Streaming
Работа със системи за препоръки
Работа с Kafka, Sqoop, Kafka и Flume
Apache Mahout със Spark и Hadoop
Отстраняване на проблеми
Обобщение и следващи стъпки
Изисквания
- Опит с Spark и Hadoop
- Опит в програмирането с Python
Аудитория
- Специалисти по данни
- Разработчици
Отзиви от участници (3)
Фактът, че можехме да вземем със себе си повечето от информацията/курса/презентацията/упражненията, които сме извършили, така че да можем да ги разгледаме отново и възможно е да повторим това, което не сме разбрали първоначално, или подобрим това, което вече сме направили.
Raul Mihail Rat - Accenture Industrial SS
Курс - Python, Spark, and Hadoop for Big Data
Машинен превод
Ми ми хареса, че упражнението успя да заложи основите на темата и същевременно да предложи някои доста продвинати упражнения. Освен това беше предоставено лесен начин за записване и тестирване на кода.
Ionut Goga - Accenture Industrial SS
Курс - Python, Spark, and Hadoop for Big Data
Машинен превод
Живите примери
Ahmet Bolat - Accenture Industrial SS
Курс - Python, Spark, and Hadoop for Big Data
Машинен превод