План на курса

Въведение

Обзор на подходите към достъп до данни (Hive, бази от данни и др.)

Обзор на функционалностите и архитектурата на Spark

Инсталиране и конфигуриране на Spark

Разбиране на Dataframes в Spark

Дефиниране на таблици и import на набори от данни

Изпълнение на заявки към Data Frames с SQL

Провеждане на агрегации, JOINs и вложените заявки

Качене и достъп до данни

Изпълнение на заявки за различни типове данни

  • JSON, Parquet и др.

Изпълнение на заявки към Data Lakes с SQL

Оправяне на грешки

Самоописание и заключение

Изисквания

  • Знание в SQL заявки
  • Опит с програмиране на който и да е език

Публика

  • Анализатори на данни
  • Научници за данни
  • Инженери по данни
 7 часа

Брой участници


Цена за участник

Отзиви от потребители (5)

Предстоящи Курсове

Свързани Kатегории