План на курса
Въведение
Преглед на подходите за достъп до данни (Hive, бази данни и др.)
Преглед на характеристиките и архитектурата на Spark
Инсталиране и конфигуриране на Spark
Разбиране на Dataframes в Spark
Дефиниране на таблици и импортиране на набори от данни
Запитване на рамки с данни с помощта на SQL
Извършване на агрегиране, JOIN и вложени заявки
Качване и Accessкачване на данни
Запитване за различни типове данни
- JSON, Parquet и др.
Запитване на езера с данни с SQL
Отстраняване на неизправности
Обобщение и заключение
Изисквания
- Опит с SQL заявки
- Опит в програмирането на всеки език
Публика
- Анализатори на данни
- Учени по данни
- Инженери по данни
Oтзиви от потребители (8)
I liked that it was practical. Loved to apply the theoretical knowledge with practical examples.
Aurelia-Adriana - Allianz Services Romania
Course - Python and Spark for Big Data (PySpark)
Много практически примери, различни начини за подход към един и същ проблем и понякога не толкова очевидни трикове как да се подобри текущото решение
Rafał - Nordea
Course - Apache Spark MLlib
Machine Translated
This is one of the best hands-on with exercises programming courses I have ever taken.
Laura Kahn
Course - Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
Sufficient hands on, trainer is knowledgable
Chris Tan
Course - A Practical Introduction to Stream Processing
The VM I liked very much The Teacher was very knowledgeable regarding the topic as well as other topics, he was very nice and friendly I liked the facility in Dubai.
Safar Alqahtani - Elm Information Security
Course - Big Data Analytics in Health
Having hands on session / assignments
Poornima Chenthamarakshan - Intelligent Medical Objects
Course - Apache Spark in the Cloud
very interactive...
Richard Langford
Course - SMACK Stack for Data Science
Ангажираност и желание за обяснение на второстепенни теми.
Marek - Krajowy Rejestr Długów Biuro Informacji Gospodarczej S.A.
Course - Apache Spark Fundamentals
Machine Translated