План на курса

Въведение

    Apache Spark срещу Hadoop MapReduce

Преглед на Apache Spark функции и архитектура

Избор на Programming език

Настройка Apache Spark

Създаване на примерно приложение

Избор на набор от данни

Изпълнение на Data Analysis върху данните

Обработка на структурирани данни с Spark SQL

Обработка на поточни данни с Spark Streaming

Интегриране на Apache Spark с инструменти 3-та част Machine Learning.

Използване на Apache Spark за обработка на графики

Оптимизиране Apache Spark

Отстраняване на неизправности

Обобщение и заключение

Изисквания

  • Опит с командния ред на Linux
  • Общо разбиране за обработка на данни
  • Опит в програмирането с Java, Scala, Python или R

Публика

  • Разработчици
 21 Hours

Брой участници



Цена за участник

Oтзиви от потребители (2)

Свързани Kурсове

Introduction to Graph Computing

28 Hours

Big Data Analytics in Health

21 Hours

Hadoop and Spark for Administrators

35 Hours

Magellan: Geospatial Analytics on Spark

14 Hours

Scaling Data Pipelines with Spark NLP

14 Hours

Свързани Kатегории