План на курса

Въведение в платформата Stratio

  • Обзор на архитектурата и основните модули на Stratio
  • Ролята на Rocket и Intelligence в цикъла на данните
  • Влизане в системата и навигация в интерфейса на Stratio

Работа с модула Rocket

  • Внасяне на данни и създаване на канали
  • Съединение на източници на данни и конфигуриране на трансформации
  • Използване на PySpark за предварителни задачи в Rocket

PySpark Основи за потребителите на Stratio

  • PySpark структури на данни и операции
  • Циклични конструкции: използване на for, while, if/else
  • Създаване на потребителски функции с def и им приложение

Разширено използване на Rocket с PySpark

  • Стрийминг внасяне и трансформации
  • Използване на цикли и функции в батч и реалтайм сценарии
  • Най-добите практики за производителност в PySpark канали

Разследване на модула Intelligence

  • Обзор на функциите за моделиране и анализ на данни
  • Избор, трансформация и разследване на характеристики
  • Ролята на PySpark в кастомизирани анализи и инсайти

Създаване на напреднали аналитични работилници

  • Създаване на потребителски функции (UDFs) в Intelligence
  • Прилагане на условия и цикли за логика на данни
  • Примери за употреба: сегментация, агрегация и предсказване

Развой и Collaboration

  • Запазване, експортиране и повторно използване на работилници
  • Сътрудничество с други членове на екипа в Stratio
  • Преглед на изход и интеграция с инструменти за обработка на данни

Резюме и следващи стъпки

Изисквания

  • Опит с програмиране на Python
  • Разбиране на концепциите за анализ на данни или обработка на големи данни
  • Основни познания за Apache Spark и разпределено компютърно изчисление

Целева аудитория

  • Инженери по данни, работейки на платформи базирани на Stratio
  • Аналитици или разработчици, използващи модулите Rocket и Intelligence
  • Технически екипи, преминаващи към работни процеси с PySpark в Stratio
 14 Часа

Брой участници


Цена за участник

Oтзиви от потребители (5)

Предстоящи Курсове

Свързани Kатегории