План на курса

Въведение

Преглед на подходите за достъп до данни (Hive, бази данни и др.)

Преглед на характеристиките и архитектурата на Spark

Инсталиране и конфигуриране на Spark

Разбиране на Dataframes в Spark

Дефиниране на таблици и импортиране на набори от данни

Запитване на рамки с данни с помощта на SQL

Извършване на агрегиране, JOIN и вложени заявки

Качване и Accessкачване на данни

Запитване за различни типове данни

    JSON, Parquet и др.

Запитване на езера с данни с SQL

Отстраняване на неизправности

Обобщение и заключение

Изисквания

  • Опит с SQL заявки
  • Опит в програмирането на всеки език

Публика

  • Анализатори на данни
  • Учени по данни
  • Инженери по данни
 7 Hours

Брой участници



Цена за участник

Oтзиви от потребители (8)

Свързани Kурсове

Introduction to Graph Computing

28 Hours

Big Data Analytics in Health

21 Hours

Hadoop and Spark for Administrators

35 Hours

Magellan: Geospatial Analytics on Spark

14 Hours

Свързани Kатегории