Благодарим ви, че изпратихте вашето запитване! Един от членовете на нашия екип ще се свърже с вас скоро.
Благодарим ви, че направихте своята резервация! Един от членовете на нашия екип ще се свърже с вас скоро.
Съдържание и теми, включени в курса
Въведение:
- Apache Spark в екосистемата на Hadoop
- Кратко въведение в Python, Scala
Основи (теория):
- Архитектура
- RDD
- Трансформации и действия
- Степен, задача, зависимости
Разбиране на основите чрез средата Databricks (практически уъркшоп):
- Упражнения с RDD API
- Основни функции за действие и трансформация
- PairRDD
- Join
- Стратегии за кеширане
- Упражнения с DataFrame API
- SparkSQL
- DataFrame: select, filter, group, sort
- UDF (дефинирана от потребителя функция)
- Преглед на DataSet API
- Поточна обработка
Разбиране на внедряването чрез AWS среда (практически уъркшоп):
- Основи на AWS Glue
- Разбиране на разликите между AWS EMR и AWS Glue
- Примерни задачи в двете среди
- Разбиране на предимствата и недостатъците
Допълнително:
- Въведение в оркестрацията с Apache Airflow
Изисквания
Умения за програмиране (за предпочитане Python, Scala)
Основи на SQL
21 Часа
Отзиви от участници (3)
Провеждане на практически сесии/задания
Poornima Chenthamarakshan - Intelligent Medical Objects
Курс - Apache Spark in the Cloud
Машинен превод
1. Правилно балансирано между високонивови концепции и технически детайли. 2. Андрас е много компетентен преподавател. 3. Упражнение
Steven Wu - Intelligent Medical Objects
Курс - Apache Spark in the Cloud
Машинен превод
Научете се за Spark Streaming, Databricks и AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Курс - Apache Spark in the Cloud
Машинен превод