План на курса
Въведение в платформата Stratio
- Обзор на архитектурата и основните модули на Stratio
- Ролята на Rocket и Intelligence в цикъла на данните
- Влизане в системата и навигация в интерфейса на Stratio
Работа с модула Rocket
- Внасяне на данни и създаване на канали
- Съединение на източници на данни и конфигуриране на трансформации
- Използване на PySpark за предварителни задачи в Rocket
PySpark Основи за потребителите на Stratio
- PySpark структури на данни и операции
- Циклични конструкции: използване на for, while, if/else
- Създаване на потребителски функции с def и им приложение
Разширено използване на Rocket с PySpark
- Стрийминг внасяне и трансформации
- Използване на цикли и функции в батч и реалтайм сценарии
- Най-добите практики за производителност в PySpark канали
Разследване на модула Intelligence
- Обзор на функциите за моделиране и анализ на данни
- Избор, трансформация и разследване на характеристики
- Ролята на PySpark в кастомизирани анализи и инсайти
Създаване на напреднали аналитични работилници
- Създаване на потребителски функции (UDFs) в Intelligence
- Прилагане на условия и цикли за логика на данни
- Примери за употреба: сегментация, агрегация и предсказване
Развой и Collaboration
- Запазване, експортиране и повторно използване на работилници
- Сътрудничество с други членове на екипа в Stratio
- Преглед на изход и интеграция с инструменти за обработка на данни
Резюме и следващи стъпки
Изисквания
- Опит с програмиране на Python
- Разбиране на концепциите за анализ на данни или обработка на големи данни
- Основни познания за Apache Spark и разпределено компютърно изчисление
Целева аудитория
- Инженери по данни, работейки на платформи базирани на Stratio
- Аналитици или разработчици, използващи модулите Rocket и Intelligence
- Технически екипи, преминаващи към работни процеси с PySpark в Stratio
Oтзиви от потребители (5)
Разнообразни практически упражнения ни позволиха да се запознаем с действието на програмата. Goясни обяснения и интеграция на теоретични концепции и как те са свързани с практическото им приложение.
Ian - Archeoworks Inc.
Курс - ArcGIS Fundamentals
Машинен превод
Всички теми, които той покрива, включително и примери. И обясни как те са полезни в нашата ежедневна работа.
madduri madduri - Boskalis Singapore Pte Ltd
Курс - QGIS for Geographic Information System
Машинен превод
Хареса ми стила на Пабло, факта, че той покриваше много теми от дизайна на отчети, персонализиране с html до прилагане на прости ML алгоритми. Goот баланс теоретична информация / упражнения. Пабло наистина обхвана всички теми, които ме интересуваха, и даде изчерпателни отговори на въпросите ми.
Cristian Tudose - SC Automobile Dacia SA
Курс - Advanced Data Analysis with TIBCO Spotfire
Машинен превод
Практично приложение на Spotfire и всички базови функции.
Michael Capili - STMicroelectronics, Inc.
Курс - Introduction to Spotfire
Машинен превод
Когато ми харесах най-много в обучението беше организацията и местоположението
Hamid Tuama - Ability with Innovation General Contracting (DMCC Branch)
Курс - ArcGIS for Spatial Analysis
Машинен превод