План на курса

Въведение

    Apache Arrow срещу Паркет

Инсталиране и конфигуриране Apache Arrow

Преглед на Apache Arrow функции и архитектура

Изследване на данни с Pandas и Apache Arrow

Изследване на данни със Spark и Apache Arrow

Изследване на данни с R и Apache Arrow

Изследване на данни с MapD и Apache Arrow

Други Data Analysis интеграции

    PySpark, Паркетни файлове на S3 и таблици на Oracle и индекси Elasticsearch

Отстраняване на неизправности

Обобщение и заключение

Изисквания

  • Основно подлепване на SQL
  • Познаване на Python или R
  • Известно познаване на Apache Spark
  14 Hours
 

Брой участници


Започва

Свършва


Dates are subject to availability and take place between 09:30 and 16:30.

Цена за участник

Oтзиви от потребители (3)

Свързани Kурсове

QGIS for Geographic Information System

  21 Hours

Свързани Kатегории