План на курса
Въведение в платформата Stratio
- Обобщение на архитектурата и основните модули на Stratio
- Ролята на Rocket и Intelligence в жизнения цикъл на данни
- Вход в системата и навигация по потребителския интерфейс на Stratio
Работа с модула Rocket
- Ингестинг и създаване на пайплайн
- Свързване с източници на данни и конфигуриране на трансформации
- Използване на PySpark за предварителна обработка в Rocket
Основи на PySpark за потребителите на Stratio
- Структури и операции с данни в PySpark
- Циклични конструкции: for, while, if/else използване
- Писане на потребителски дефинирани функции (UDFs) с def и прилагане им
Напредно използване на Rocket с PySpark
- Стримерски ингестинг и трансформации
- Използване на цикли и функции в батч и реално време сценарии
- Ръководства за производителност при пайплайните PySpark
Изучаване на модула Intelligence
- Обобщение на функциите за моделиране и анализ на данни
- Избор, трансформация и разглеждане на характеристики (features)
- Ролята на PySpark в персонализирания анализ и извлечението на инсайтове
Създаване на напредни рабочи процеси за аналитика
- Създаване на потребителски дефинирани функции (UDFs) в модула Intelligence
- Применяване на условни и циклични конструкции за логика с данни
- Употреба: сегментация, агрегация и прогнозиране
Разпространяване и сътрудничество
- Запазване, експортиране и повторно използване на рабочи процеси
- Сътрудничество с други членове от екипа в Stratio
- Ревю на изхода и интегриране с по-напреднони инструменти
Заключение и следващи стъпки
Изисквания
- Опит с програмирането на Python
- Разбиране на концепциите за анализа на данни или обработката на големи данни.
- Основно знание за Apache Spark и разпределеното изчисление
Целева група
- Специалисти по данни, работещи на платформите Stratio
- Аналитици или разработчици, използващи модулите Rocket и Intelligence
- Технически екипи, преминаващи към работни процеси с PySpark в рамките на Stratio
Отзиви от потребители (4)
Работните примери ни позволиха да усетим какво е работа с програмата. Добри обяснения и интеграция на теоретични концепции и както те се свързват с практически приложения.
Ian - Archeoworks Inc.
Курс - ArcGIS Fundamentals
Машинен превод
Всички теми, които той разгледа, включително и примерите. Обясни също как те ни помагат в нашата дневна работа.
madduri madduri - Boskalis Singapore Pte Ltd
Курс - QGIS for Geographic Information System
Машинен превод
Наистина се насладих на обучението. Намерих всички модули да бъдат приложими за проблемите, които се опитвам да решя на работа. Интеграцията на обучението с тетради Jupyter беше впечатляваща.
Mark Firmin - Environment and Climate Change Canada
Курс - Python for Geographic Information System (GIS)
Машинен превод
Това, което повече всичко ми хареса в обучението, беше организацията и местоположението
Hamid Tuama - Ability with Innovation General Contracting (DMCC Branch)
Курс - ArcGIS for Spatial Analysis
Машинен превод