План на курса
Въведение
- Преглед на характеристиките и архитектурата на Spark и Hadoop.
- Разбиране на големи данни
- Python основи на програмирането
Приготвяме се да започнем
- Настройка на Python, Spark и Hadoop
- Разбиране на структурите от данни в Python
- Разбиране на PySpark API
- Разбиране на HDFS и MapReduce
Интегриране на Spark и Hadoop с Python
- Внедряване на Spark RDD в Python
- Обработка на данни с помощта на MapReduce
- Създаване на разпределени набори от данни в HDFS
Machine Learning с Spark MLlib
Обработка Big Data с Spark Streaming
Работа с Recommender Systems
Работа с Kafka, Sqoop, Kafka и Flume
Apache Mahout със Spark и Hadoop
Отстраняване на неизправности
Обобщение и следващи стъпки
Изисквания
- Опит със Spark и Hadoop
- Python опит в програмирането
Публика
- Учени по данни
- Разработчици
Отзиви от потребители (3)
Фактът, че можехме да вземем със себе си повечето от информацията/курса/презентацията/упражненията, които сме извършили, така че да можем да ги разгледаме отново и възможно е да повторим това, което не сме разбрали първоначално, или подобрим това, което вече сме направили.
Raul Mihail Rat - Accenture Industrial SS
Курс - Python, Spark, and Hadoop for Big Data
Машинен превод
Ми ми хареса, че упражнението успя да заложи основите на темата и същевременно да предложи някои доста продвинати упражнения. Освен това беше предоставено лесен начин за записване и тестирване на кода.
Ionut Goga - Accenture Industrial SS
Курс - Python, Spark, and Hadoop for Big Data
Машинен превод
Живите примери
Ahmet Bolat - Accenture Industrial SS
Курс - Python, Spark, and Hadoop for Big Data
Машинен превод