План на курса

Въведение

Преглед на подходите за достъп до данни (Hive, бази данни и др.)

Преглед на характеристиките и архитектурата на Spark

Инсталиране и конфигуриране на Spark

Разбиране на Dataframes в Spark

Дефиниране на таблици и импортиране на набори от данни

Запитване на рамки с данни с помощта на SQL

Извършване на агрегиране, JOIN и вложени заявки

Качване и Accessкачване на данни

Запитване за различни типове данни

    JSON, Parquet и др.

Запитване на езера с данни с SQL

Отстраняване на неизправности

Обобщение и заключение

Изисквания

  • Опит с SQL заявки
  • Опит в програмирането на всеки език

Публика

  • Анализатори на данни
  • Учени по данни
  • Инженери по данни
 7 Hours

Брой участници



Цена за участник

Oтзиви от потребители (8)

Свързани Kурсове

Introduction to Graph Computing

28 Hours

Magellan: Geospatial Analytics on Spark

14 Hours

Big Data Analytics in Health

21 Hours

Hadoop and Spark for Administrators

35 Hours

Свързани Kатегории