План на курса
Въведение
Преглед на подходите за достъп до данни (Hive, бази данни и др.)
Преглед на характеристиките и архитектурата на Spark
Инсталиране и конфигуриране на Spark
Разбиране на Dataframes в Spark
Дефиниране на таблици и импортиране на набори от данни
Запитване на рамки с данни с помощта на SQL
Извършване на агрегиране, JOIN и вложени заявки
Качване и Accessкачване на данни
Запитване за различни типове данни
- JSON, Parquet и др.
Запитване на езера с данни с SQL
Отстраняване на неизправности
Обобщение и заключение
Изисквания
- Опит с SQL запитвания
- Опит с програмиране на всеки език
Целова публика
- Аналитици на данни
- Научни работници по данни
- Инженери на данни
Отзиви от потребители (5)
Примери в реално време
Ahmet Bolat - Accenture Industrial SS
Курс - Python, Spark, and Hadoop for Big Data
Машинен превод
очень интерактивен...
Richard Langford
Курс - SMACK Stack for Data Science
Машинен превод
Достъпен практическо обучение, треньорът е компетентен
Chris Tan
Курс - A Practical Introduction to Stream Processing
Машинен превод
Започнете да се запознавате с Spark Streaming, Databricks и AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Курс - Apache Spark in the Cloud
Машинен превод
задачи за практика
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Курс - Python and Spark for Big Data (PySpark)
Машинен превод