План на курса
Въведение
- Преглед на характеристиките и архитектурата на Spark и Hadoop.
- Разбиране на големи данни
- Python основи на програмирането
Приготвяме се да започнем
- Настройка на Python, Spark и Hadoop
- Разбиране на структурите от данни в Python
- Разбиране на PySpark API
- Разбиране на HDFS и MapReduce
Интегриране на Spark и Hadoop с Python
- Внедряване на Spark RDD в Python
- Обработка на данни с помощта на MapReduce
- Създаване на разпределени набори от данни в HDFS
Machine Learning с Spark MLlib
Обработка Big Data с Spark Streaming
Работа с Recommender Systems
Работа с Kafka, Sqoop, Kafka и Flume
Apache Mahout със Spark и Hadoop
Отстраняване на неизправности
Обобщение и следващи стъпки
Изисквания
- Опит със Spark и Hadoop
- Python опит в програмирането
Публика
- Учени по данни
- Разработчици
Oтзиви от потребители (3)
Същото, че сме могли да вземем с нас повечето информация/курс/презентация/упражнения, така че да можем да ги прегледаме и може би да преправим това, което не разбрахме на първо място, или да подобрим това, което вече сме направили.
Raul Mihail Rat - Accenture Industrial SS
Курс - Python, Spark, and Hadoop for Big Data
Машинен превод
Бях доволен, че успях да си постав основите на темата и да се добера до доста напреднали упражнения. Освен това, дава лесни начини за писане/тестване на кода.
Ionut Goga - Accenture Industrial SS
Курс - Python, Spark, and Hadoop for Big Data
Машинен превод
Примери в реално време
Ahmet Bolat - Accenture Industrial SS
Курс - Python, Spark, and Hadoop for Big Data
Машинен превод