План на курса

Въведение

    Преглед на Databricks и Apache Spark Разбиране на Databricks архитектурата

Приготвяме се да започнем

    Настройване на средата Настройване и конфигуриране на Databricks Навигация в Databricks потребителския интерфейс Създаване на Databricks работно пространство

Работа с данни в Databricks

    Свързване към Apache Spark източник на данни Разбиране на основните колони и типове данни Управление на файлова система в бележници

Управление на работни места и клъстери

    Създаване и конфигуриране на клъстери Създаване на задания с помощта на Notebook Изпълнени задания Преглед на задания и подробности за задания

Използване на Delta Lake в Databricks

    Зареждане на данни в Delta Lake Управление на данни в Delta Lake

Обезопасяване Databricks

    Управление на Databricks сигурността Управление на архивиране и възстановяване

Отстраняване на неизправности

Обобщение и следващи стъпки

Изисквания

  • Основно разбиране на анализа на данни
  • Познаване на Apache Spark

Публика

  • Инженери по данни
  • Учени по данни
  • Разработчици
 14 Hours

Брой участници



Цена за участник

Oтзиви от потребители (2)

Свързани Kурсове

Apache Arrow for Data Analysis across Disparate Data Sources

14 Hours

Azure for Data Engineer

35 Hours

Data Analysis for Marketers

14 Hours

Datameer for Data Analysts

14 Hours

Dremio for Self-Service Data Analysis

21 Hours

Свързани Kатегории