План на курса

Въведение

  • Преглед на Databricks и Apache Spark
  • Разбиране на Databricks архитектурата

Първи стъпки

  • Настройка на околната среда
  • Настройка и конфигуриране Databricks
  • Навигация в потребителския интерфейс Databricks.
  • Създаване на Databricks работно пространство

Работа с данни в Databricks

  • Свързване към Apache Spark източник на данни
  • Разбиране на основните колони и типове данни
  • Управление на файлова система в преносими компютри

Управление на работни места и клъстери

  • Създаване и конфигуриране на клъстери
  • Създаване на работни места с помощта на Notebook
  • Течащи работни места
  • Преглед на работни места и подробности за работата

Използване на Delta Lake в Databricks

  • Зареждане на данни в Delta Lake
  • Управление на данни в Delta Lake

Обезопасяване Databricks

  • Управление на Databricks сигурността
  • Управление на архивиране и възстановяване

Отстраняване на неизправности

Обобщение и следващи стъпки

Изисквания

  • Основно разбиране на анализа на данни
  • Познаване на Apache Spark

Публика

  • Инженери по данни
  • Учени по данни
  • Разработчици
 14 Часа

Брой участници


Цена за участник

Предстоящи Курсове

Свързани Kатегории