План на курса
Въведение в DataStage
- Общ преглед на ETL процеса
- Разбиране на архитектурата на DataStage
- Ключови компоненти на DataStage
Администриране на DataStage
- Инсталация и конфигурация
- Управление на потребители и сигурност
- Настройка на проекти и управление на околнините
- Планиране и управление на задачи
- Процедури за бекъп и възстановяване
Техники за извличане на данни
- Свързане с различни източници на данни
- Извличане на данни от бази данни, плоски файлове и външни източници
- Лучши практики за извличане на данни
Преобразуване на данни с DataStage
- Разбиране на конструктора на DataStage
- Работа с различни типове стадии
- Прилагане на бизнес логика в преобразуванията
- Продвинати техники за преобразуване на данни
Зареждане и интегриране на данни
- Зареждане на данни в целеви системи
- Гарантиране на качеството и цялостта на данните
- Обработка на грешки и логване
Оптимизация за производителност
- Лучши практики за оптимизацията на производителността
- Управление на ресурси
- Планиране и паралелизъм на задачите
Продвинати теми
- Работа с DataStage director
- Отстраняване на грешки и разкриване
Общо резюме и следващи стъпки
Изисквания
- Основно разбиране на концепции за бази данни
- Познаване на SQL и принципите на данните хранилища
Публика
- IT професионалисти
- Администратори на бази данни
- Разработчици
Отзиви от потребители (5)
Живите примери
Ahmet Bolat - Accenture Industrial SS
Курс - Python, Spark, and Hadoop for Big Data
Машинен превод
много интерактивно...
Richard Langford
Курс - SMACK Stack for Data Science
Машинен превод
Достатъчно практически упражнения, преподавателят е добре подготвен
Chris Tan
Курс - A Practical Introduction to Stream Processing
Машинен превод
Научете се за Spark Streaming, Databricks и AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Курс - Apache Spark in the Cloud
Машинен превод
практически задания
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Курс - Python and Spark for Big Data (PySpark)
Машинен превод