План на курса

Въведение

  • Обзор на Databricks и Apache Spark
  • Разбиране на архитектурата на Databricks

Започване с работа

  • Настройка на околната среда
  • Инсталиране и конфигуриране на Databricks
  • Навигация в потребителския интерфейс на Databricks
  • Създаване на работно пространство в Databricks

Работа с данни в Databricks

  • Подключване към източник на данни Apache Spark
  • Разбиране на основите за колони и типове данни
  • Управление на файловата система в тетрадки (Notebooks)

Управление на задачи и кластери

  • Създаване и конфигуриране на кластери
  • Създаване на задачи с използване на тетрадки (Notebooks)
  • Изпълнение на задачи
  • Преглеждане на задачи и детайли за задачите

Използване на Delta Lake в Databricks

  • Зареждане на данни в Delta Lake
  • Управление на данните в Delta Lake

Сигурността на Databricks

  • Управление на сигурността на Databricks
  • Управление на резервни копия и възстановяване

Разбиране на проблеми

Общо заключение и следващи стъпки

Изисквания

  • Основно разбиране на данните за анализ
  • Знание във функционирането на Apache Spark

Публика

  • Данни инженери
  • Аналитици на данни
  • Разработчици
 14 часа

Брой участници


Цена за участник

Предстоящи Курсове

Свързани Kатегории