План на курса

Въведение

  • Преглед на характеристиките и архитектурата на Spark и Hadoop.
  • Разбиране на големи данни
  • Python основи на програмирането

Приготвяме се да започнем

  • Настройка на Python, Spark и Hadoop
  • Разбиране на структурите от данни в Python
  • Разбиране на PySpark API
  • Разбиране на HDFS и MapReduce

Интегриране на Spark и Hadoop с Python

  • Внедряване на Spark RDD в Python
  • Обработка на данни с помощта на MapReduce
  • Създаване на разпределени набори от данни в HDFS

Machine Learning с Spark MLlib

Обработка Big Data с Spark Streaming

Работа с Recommender Systems

Работа с Kafka, Sqoop, Kafka и Flume

Apache Mahout със Spark и Hadoop

Отстраняване на неизправности

Обобщение и следващи стъпки

Изисквания

  • Опит със Spark и Hadoop
  • Python опит в програмирането

Публика

  • Учени по данни
  • Разработчици
 21 Часа

Брой участници


Цена за участник

Oтзиви от потребители (3)

Предстоящи Курсове

Свързани Kатегории