План на курса

Въведение

    Apache Arrow срещу Паркет

Инсталиране и конфигуриране Apache Arrow

Преглед на Apache Arrow функции и архитектура

Изследване на данни с Pandas и Apache Arrow

Изследване на данни със Spark и Apache Arrow

Изследване на данни с R и Apache Arrow

Изследване на данни с MapD и Apache Arrow

Други Data Analysis интеграции

    PySpark, Паркетни файлове на S3 и таблици на Oracle и индекси Elasticsearch

Отстраняване на неизправности

Обобщение и заключение

Изисквания

  • Основно подлепване на SQL
  • Познаване на Python или R
  • Известно познаване на Apache Spark
 14 Hours

Брой участници



Цена за участник

Oтзиви от потребители (5)

Свързани Kурсове

QGIS for Geographic Information System

21 Hours

Свързани Kатегории