План на курса
Въведение
Обзор на подходите към достъп до данни (Hive, бази от данни и др.)
Обзор на функционалностите и архитектурата на Spark
Инсталиране и конфигуриране на Spark
Разбиране на Dataframes в Spark
Дефиниране на таблици и import на набори от данни
Изпълнение на заявки към Data Frames с SQL
Провеждане на агрегации, JOINs и вложените заявки
Качене и достъп до данни
Изпълнение на заявки за различни типове данни
- JSON, Parquet и др.
Изпълнение на заявки към Data Lakes с SQL
Оправяне на грешки
Самоописание и заключение
Изисквания
- Знание в SQL заявки
- Опит с програмиране на който и да е език
Публика
- Анализатори на данни
- Научници за данни
- Инженери по данни
Отзиви от потребители (5)
Живите примери
Ahmet Bolat - Accenture Industrial SS
Курс - Python, Spark, and Hadoop for Big Data
Машинен превод
много интерактивно...
Richard Langford
Курс - SMACK Stack for Data Science
Машинен превод
Достатъчно практически упражнения, преподавателят е добре подготвен
Chris Tan
Курс - A Practical Introduction to Stream Processing
Машинен превод
Научете се за Spark Streaming, Databricks и AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Курс - Apache Spark in the Cloud
Машинен превод
практически задания
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Курс - Python and Spark for Big Data (PySpark)
Машинен превод