Благодарим ви, че изпратихте вашето запитване! Един от членовете на нашия екип ще се свърже с вас скоро.
Благодарим ви, че направихте своята резервация! Един от членовете на нашия екип ще се свърже с вас скоро.
План на курса
Въведение в Teradata
Модул 1: Основи на Teradata и нейната архитектура
- Какво е Teradata и за какво се използва?
- Паралелна архитектура: AMPs, PEs, BYNET
- Разпределение на данни и хеширане
- Ключови концепции: сесии, spool, locks
- Свързване към системата: Teradata Studio / BTEQ / SQL Assistant
Модул 2: Въведение в SQL в Teradata
- Основен SELECT, WHERE, ORDER BY
- Типове данни и преобразуване (casting)
- Математически и датови функции
- Използване на ALIAS, изрази CASE
- Специални оператори на Teradata (TOP, QUALIFY, SAMPLE)
- Упражнения с упътване: заявки в реални таблици
Модул 3: Joins, Subqueries и Set Operators
- INNER, LEFT, RIGHT, FULL OUTER JOIN
- Joins без клauза ON (картински произведение)
- Скаларни и корелационни подзаявки
- UNION, INTERSECT, MINUS
- Практически упражнения за интегриране на данни
Модул 4: Аналитични функции и OLAP
- RANK(), ROW_NUMBER(), DENSE_RANK()
- Разделение на данни с PARTITION BY
- Прозорци с OVER() и ORDER BY
- LAG(), LEAD(), FIRST_VALUE()
- Практически случаи: KPIs, тенденции, акумулации
Модул 5: Управление на данни и таблиците
- Типове таблици: постоянни, превременни, глобално временни
- Създаване и използване на вторични индекси и join indexes
- Вмъкване, актуализация и изтриване на записи
- MERGE, UPSERT и контрол на дублиранията
- Транзакции и управление на locks
Модул 6: Оптимизация и подобряване на производителността
- Оптимизаторът на Teradata: как се решава за плановете
- Използване на EXPLAIN и COLLECT STATISTICS
- Скев (skew) и как да се избегне
- Най-добри практики за проектирането на заявки
- Идентифициране на узки места (spool, locks, преразпределение)
- Практика: сравнение между оптимизирани и неоптимизирани заявки
Модул 7: Партициониране и компресия на данни
- Типове партициониране: Range, Case, Multi-Level
- Практически предимства и използване в големи заявки
- Компресия на ниво блок (BLC) и колонна компресия
- Предимства и ограничения
Модул 8: Зареждане и извличане на данни
- TPT (Teradata Parallel Transporter) спрямо FastLoad / MultiLoad
- Масово зареждане спрямо батч вмъкване
- Обработка на грешки и повторни опити
- Експортиране на резултатите във файлове или извън системата
- Основна автоматизация с скриптове и утилити
Модул 9: Основно управление за технически потребители
- Роли и права
- Управление на ресурси (Query Bands, Priority Scheduler)
- Мониторинг с DBQLOGTBL, DBC.Tables, ResUsage
- Най-добри практики за споделени среди
Модул 10: Крайно интеграционно лабораторно упражнение
-
Практически случай от край до край:
- Зареждане на данни
- Трансформация и агрегиране
- Построяване на индикатори с аналитични функции
- Оптимизация и обяснение
- Крайно експортиране
- Обсъждане на най-добри практики и често срещани грешки
Изисквания
- Разбиране на релационните бази данни и концепцията SQL
- Опит с изпълняване на заявки към голями набори от данни или работа в околната среда за данни
- Запознаност с цели и задачи в бизнес-интелигентността или аналитиката
Публика
- Аналисти на данни и професионалисти в бизнес-интелигентността
- Разработчици SQL и инженери по данни
- Технически потребители, които управляват или оптимизират данните в околната среда Teradata
35 часа
Отзиви от потребители (1)
Nice training, full of interesting topics. After each topic helpful examples were provided.