План на курса

Въведение в Apache Spark

  • Ролята на Spark в обработката на големи данни
  • Spark архитектура и нейните компоненти

Настройка Apache Spark

  • Хардуерни и софтуерни изисквания
  • Инсталационни процедури за самостоятелни и клъстерни режими
  • Най-добри практики за конфигуриране за системни администратори

Администриране на Spark клъстери

  • Инструменти и техники за управление на клъстери
  • Мониторинг на Spark приложения и клъстерни ресурси
  • Конфигурации за сигурност и управление на потребителите

Настройка и оптимизиране на производителността

  • Разпределение на ресурсите и планиране
  • Tuning Spark за оптимална производителност
  • Идентифициране и разрешаване на често срещани тесни места

Отстраняване на неизправности и решаване на проблеми

  • Често срещани предизвикателства при администрирането на Spark
  • Диагностични инструменти и техники за отстраняване на проблеми
  • Подход стъпка по стъпка за разрешаване на често срещани проблеми
  • Най-добри практики за поддържане на здравословна среда на Spark

Теми за разширено администриране

  • Интеграция с други инструменти за големи данни
  • Осигуряване на висока наличност и възстановяване след бедствие
  • Надграждане и мащабиране на клъстери на Spark

Обобщение и следващи стъпки

Изисквания

  • Основни познания за мрежова конфигурация и управление
  • Познаване на операционната система Linux и интерфейса на командния ред
  • Интерес към изучаване на разпределени изчислителни системи и управление на големи данни

Публика

  • Системни администратори
 35 Hours

Брой участници



Цена за участник

Oтзиви от потребители (9)

Свързани Kурсове

Introduction to Graph Computing

28 Hours

Big Data Analytics in Health

21 Hours

Hadoop and Spark for Administrators

35 Hours

Magellan: Geospatial Analytics on Spark

14 Hours

Scaling Data Pipelines with Spark NLP

14 Hours

Свързани Kатегории