План на курса
Въведение в DataStage
- Обзор на процеса ETL
- Разбиране на архитектурата на DataStage
- Основни компоненти на DataStage
Управление с DataStage
- Инсталация и конфигуриране
- Управление на потребителите и сигурността
- Настройка на проекти и управление на средата
- Планиране и управление на задачи
- Процедури за резервно копиране и възстановяване
Техники за извличане на данни
- Връзване с различни източници на данни
- Извличане на данни от бази данни, плоски файлове и външни източници
- Най-добри практики за извличане на данни
Преработка на данни с DataStage
- Разбиране на DataStage designer
- Работа с различни типове етапи
- Реализация на бизнес логика в преработки
- Напреднали техники за преработка на данни
Зареждане и интеграция на данни
- Зареждане на данни в целови системи
- Осигуряване на качество и целостност на данните
- Обработка на грешки и записване на логи
Оптимизация и подбиране на производителност
- Най-добри практики за подбиране на производителност
- Управление на ресурси
- Последователност на задачи и паралелизъм
Напреднали теми
- Работа с DataStage director
- Отстраняване на грешки и диагностика
Резюме и следващи стъпки
Изисквания
- Основни познания за концепции на бази данни
- Знание на SQL и принципи на сторожилище на данни
Целева група
- ИТ професионалисти
- Администратори на бази данни
- Разработчици
Отзиви от потребители (5)
Примери в реално време
Ahmet Bolat - Accenture Industrial SS
Курс - Python, Spark, and Hadoop for Big Data
Машинен превод
очень интерактивен...
Richard Langford
Курс - SMACK Stack for Data Science
Машинен превод
Достъпен практическо обучение, треньорът е компетентен
Chris Tan
Курс - A Practical Introduction to Stream Processing
Машинен превод
Започнете да се запознавате с Spark Streaming, Databricks и AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Курс - Apache Spark in the Cloud
Машинен превод
задачи за практика
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Курс - Python and Spark for Big Data (PySpark)
Машинен превод
