Свържете се с нас

Съдържание и теми, включени в курса

Въведение

  • Преглед на характеристиките и архитектурата на Spark и Hadoop
  • Разбиране на големите данни
  • Основи на програмирането с Python

Първи стъпки

  • Настройка на Python, Spark и Hadoop
  • Разбиране на структурите от данни в Python
  • Разбиране на PySpark API
  • Разбиране на HDFS и MapReduce

Интегриране на Spark и Hadoop с Python

  • Внедряване на Spark RDD в Python
  • Обработка на данни с помощта на MapReduce
  • Създаване на разпределени набори от данни в HDFS

Машинно обучение със Spark MLlib

Обработка на големи данни със Spark Streaming

Работа със системи за препоръки

Работа с Kafka, Sqoop, Kafka и Flume

Apache Mahout със Spark и Hadoop

Отстраняване на проблеми

Обобщение и следващи стъпки

Изисквания

  • Опит с Spark и Hadoop
  • Опит в програмирането с Python

Аудитория

  • Специалисти по данни
  • Разработчици
 21 Часа

Брой участници


Цена за участник

Отзиви от участници (3)

Предстоящи Курсове

Свързани Kатегории