План на курса

Въведение в Teradata

Модул 1: Основни понятия и архитектура на Teradata

  • Какво е Teradata и за какво се използва?
  • Паралелна архитектура: AMPs, PEs, BYNET
  • Разпределение на данни и хеширане
  • Ключови понятия: сесии, spool, замъци
  • Включване в системата: Teradata Studio / BTEQ / SQL Assistant

Модул 2: Въведение в SQL в Teradata

  • Основни SELECT, WHERE, ORDER BY
  • Типове данни и кастинг
  • Математически и датни функции
  • Използване на ALIAS, CASE изрази
  • Специфични за Teradata оператори (TOP, QUALIFY, SAMPLE)
  • Насочена практика: запрашиване на реални таблици

Модул 3: Съединения, подзапроси и оператори за множества

  • INNER, LEFT, RIGHT, FULL OUTER JOIN
  • Съединения без ON клауза (картезиански продукт)
  • Скаларни и корелирани подзапроси
  • UNION, INTERSECT, MINUS
  • Практически упражнения за интеграция на данни

Модул 4: Аналитични и OLAP функции

  • RANK(), ROW_NUMBER(), DENSE_RANK()
  • Разделяне на данни с PARTITION BY
  • Променливо проучване с OVER() и ORDER BY
  • LAG(), LEAD(), FIRST_VALUE()
  • Приложения: KPIs, трендове, кумулативни стойности

Модул 5: Данни и таблици Management

  • Типове таблици: постоянни, променливи, глобално временни
  • Създаване и използване на вторични и съединени индекси
  • Операции за добавяне, обновяване и изтриване
  • MERGE, UPSERT, и контрол на дубликати
  • Транзакции и контрол на замъците

Модул 6: Оптимизация и подбиране на производителност

  • Teradata Оптимизатор: как избират планове за изпълнение
  • Използване на EXPLAIN и COLLECT STATISTICS
  • Склонност и как да се избегне
  • Най-добри практики за дизайн на запрашивания
  • Идентификация на флашови точки (spool, замъци, преразпределение)
  • Практика: сравняване на оптимизирани срещу неоптимизирани запрашивания

Модул 7: Разделяне на данни и компресия

  • Типове разделяне: Range, Case, Multi-Level
  • Предности и практично използване при големи запрашивания
  • Компресия на блокови ниво (BLC) и компресия на колони
  • Предности и ограничения

Модул 8: Зареждане и извличане на данни

  • TPT (Teradata Паралелен Транспортър) срещу FastLoad / MultiLoad
  • Масово зареждане срещу батчове за добавяне
  • Обработка на грешки и повторни опити
  • Износ на резултати в файлове или външни системи
  • Основна автоматизация с скриптове и утилити

Модул 9: Основна администрация за технически потребители

  • Роли и разрешения
  • Контрол на ресурси (Query Bands, Priority Scheduler)
  • Мониторинг с DBQLOGTBL, DBC.Tables, ResUsage
  • Най-добри практики за споделяни среди

Модул 10: Конечен интеграционен лабораториум

  • Практичен случай от края на края:
  • Зареждане на данни
  • Преобразуване и агрегация
  • Създаване на KPIs с OLAP функции
  • Оптимизация и EXPLAIN
  • Конечен износ
  • Обсъждане на най-добри практики и често срещани грешки

Резюме и следващи стъпки


Изисквания

  • Разбиране на релационни бази данни и SQL концепции
  • Опит в заявяване на големи набори данни или работа в среда на данни
  • Знакомство с бизнес интелигенция или цели на аналитика

Целева аудитория

  • Аналитици на данни и професионалисти в областта на бизнес интелигенция
  • SQL разработчици и инженери на данни
  • Технически потребители, управляващи или оптимизиращи данни в Teradata среди
 35 часа

Брой участници


Цена за участник

Отзиви от потребители (1)

Предстоящи Курсове

Свързани Kатегории