План на курса

Въведение

    Преглед на характеристиките и архитектурата на Spark и Hadoop Разбиране на основите на програмирането на големи данни Python.

Приготвяме се да започнем

    Настройване на Python, Spark и Hadoop Разбиране на структурите от данни в Python Разбиране на PySpark API Разбиране на HDFS и MapReduce

Интегриране на Spark и Hadoop с Python

    Внедряване на Spark RDD в Python Обработка на данни с помощта на MapReduce Създаване на разпределени набори от данни в HDFS

Machine Learning с Spark MLlib

Обработка на големи данни с Spark Streaming

Работа с Recommender Systems

Работа с Kafka, Sqoop, Kafka и Flume

Apache Mahout със Spark и Hadoop

Отстраняване на неизправности

Обобщение и следващи стъпки

Изисквания

  • Опит със Spark и Hadoop
  • Python опит в програмирането

Публика

  • Учени по данни
  • Разработчици
 21 Hours

Брой участници



Цена за участник

Oтзиви от потребители (3)

Свързани Kурсове

Introduction to Graph Computing

28 Hours

Свързани Kатегории