План на курса

Въведение

    Apache Spark срещу Hadoop MapReduce

Преглед на Apache Spark функции и архитектура

Избор на Programming език

Настройка Apache Spark

Създаване на примерно приложение

Избор на набор от данни

Изпълнение на Data Analysis върху данните

Обработка на структурирани данни с Spark SQL

Обработка на поточни данни с Spark Streaming

Интегриране на Apache Spark с инструменти 3-та част Machine Learning.

Използване на Apache Spark за обработка на графики

Оптимизиране Apache Spark

Отстраняване на неизправности

Обобщение и заключение

Изисквания

  • Опит с командния ред на Linux
  • Общо разбиране за обработка на данни
  • Опит в програмирането с Java, Scala, Python или R

Публика

  • Разработчици
 21 Hours

Брой участници



Цена за участник

Oтзиви от потребители (2)

Свързани Kурсове

Introduction to Graph Computing

28 Hours

Magellan: Geospatial Analytics on Spark

14 Hours

Apache Spark SQL

7 Hours

Big Data Analytics in Health

21 Hours

Hadoop and Spark for Administrators

35 Hours

Свързани Kатегории