План на курса
Въведение в платформата Stratio
- Обобщение на архитектурата и основните модули на Stratio
- Ролята на Rocket и Intelligence в жизнения цикъл на данни
- Вход в системата и навигация по потребителския интерфейс на Stratio
Работа с модула Rocket
- Ингестинг и създаване на пайплайн
- Свързване с източници на данни и конфигуриране на трансформации
- Използване на PySpark за предварителна обработка в Rocket
Основи на PySpark за потребителите на Stratio
- Структури и операции с данни в PySpark
- Циклични конструкции: for, while, if/else използване
- Писане на потребителски дефинирани функции (UDFs) с def и прилагане им
Напредно използване на Rocket с PySpark
- Стримерски ингестинг и трансформации
- Използване на цикли и функции в батч и реално време сценарии
- Ръководства за производителност при пайплайните PySpark
Изучаване на модула Intelligence
- Обобщение на функциите за моделиране и анализ на данни
- Избор, трансформация и разглеждане на характеристики (features)
- Ролята на PySpark в персонализирания анализ и извлечението на инсайтове
Създаване на напредни рабочи процеси за аналитика
- Създаване на потребителски дефинирани функции (UDFs) в модула Intelligence
- Применяване на условни и циклични конструкции за логика с данни
- Употреба: сегментация, агрегация и прогнозиране
Разпространяване и сътрудничество
- Запазване, експортиране и повторно използване на рабочи процеси
- Сътрудничество с други членове от екипа в Stratio
- Ревю на изхода и интегриране с по-напреднони инструменти
Заключение и следващи стъпки
Изисквания
- Опит с програмирането на Python
- Разбиране на концепциите за анализа на данни или обработката на големи данни.
- Основно знание за Apache Spark и разпределеното изчисление
Целева група
- Специалисти по данни, работещи на платформите Stratio
- Аналитици или разработчици, използващи модулите Rocket и Intelligence
- Технически екипи, преминаващи към работни процеси с PySpark в рамките на Stratio
Отзиви от потребители (4)
Когато ми харесах най-много в обучението беше организацията и местоположението
Hamid Tuama - Ability with Innovation General Contracting (DMCC Branch)
Курс - ArcGIS for Spatial Analysis
Машинен превод
Разнообразни практически упражнения ни позволиха да се запознаем с действието на програмата. Goясни обяснения и интеграция на теоретични концепции и как те са свързани с практическото им приложение.
Ian - Archeoworks Inc.
Курс - ArcGIS Fundamentals
Машинен превод
Отрядно се радвам на обучението. Намерен съм, че всички модули са приложими към проблеми, с които се сблъсквам на работа. Интеграцията на обучението с Jupyter Notebooks беше впечатляваща.
Mark Firmin - Environment and Climate Change Canada
Курс - Python for Geographic Information System (GIS)
Машинен превод
Всички теми, които той покрива, включително и примери. И обясни как те са полезни в нашата ежедневна работа.
madduri madduri - Boskalis Singapore Pte Ltd
Курс - QGIS for Geographic Information System
Машинен превод