План на курса
Въведение в Apache Spark
- Ролята на Spark в обработката на големи данни
- Spark архитектура и нейните компоненти
Настройка Apache Spark
- Хардуерни и софтуерни изисквания
- Инсталационни процедури за самостоятелни и клъстерни режими
- Най-добри практики за конфигуриране за системни администратори
Администриране на Spark клъстери
- Инструменти и техники за управление на клъстери
- Мониторинг на Spark приложения и клъстерни ресурси
- Конфигурации за сигурност и управление на потребителите
Настройка и оптимизиране на производителността
- Разпределение на ресурсите и планиране
- Tuning Spark за оптимална производителност
- Идентифициране и разрешаване на често срещани тесни места
Отстраняване на неизправности и решаване на проблеми
- Често срещани предизвикателства при администрирането на Spark
- Диагностични инструменти и техники за отстраняване на проблеми
- Подход стъпка по стъпка за разрешаване на често срещани проблеми
- Най-добри практики за поддържане на здравословна среда на Spark
Теми за разширено администриране
- Интеграция с други инструменти за големи данни
- Осигуряване на висока наличност и възстановяване след бедствие
- Надграждане и мащабиране на клъстери на Spark
Обобщение и следващи стъпки
Изисквания
- Основни познания за мрежова конфигурация и управление
- Познаване на операционната система Linux и интерфейса на командния ред
- Интерес към изучаване на разпределени изчислителни системи и управление на големи данни
Публика
- Системни администратори
Oтзиви от потребители (8)
I liked that it was practical. Loved to apply the theoretical knowledge with practical examples.
Aurelia-Adriana - Allianz Services Romania
Course - Python and Spark for Big Data (PySpark)
Много практически примери, различни начини за подход към един и същ проблем и понякога не толкова очевидни трикове как да се подобри текущото решение
Rafał - Nordea
Course - Apache Spark MLlib
Machine Translated
This is one of the best hands-on with exercises programming courses I have ever taken.
Laura Kahn
Course - Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
Sufficient hands on, trainer is knowledgable
Chris Tan
Course - A Practical Introduction to Stream Processing
The VM I liked very much The Teacher was very knowledgeable regarding the topic as well as other topics, he was very nice and friendly I liked the facility in Dubai.
Safar Alqahtani - Elm Information Security
Course - Big Data Analytics in Health
Having hands on session / assignments
Poornima Chenthamarakshan - Intelligent Medical Objects
Course - Apache Spark in the Cloud
very interactive...
Richard Langford
Course - SMACK Stack for Data Science
Ангажираност и желание за обяснение на второстепенни теми.
Marek - Krajowy Rejestr Długów Biuro Informacji Gospodarczej S.A.
Course - Apache Spark Fundamentals
Machine Translated