План на курса

Въведение в Teradata

Модул 1: Основи на Teradata и нейната архитектура

  • Какво е Teradata и за какво се използва?
  • Паралелна архитектура: AMPs, PEs, BYNET
  • Разпределение на данни и хеширане
  • Ключови концепции: сесии, spool, locks
  • Свързване към системата: Teradata Studio / BTEQ / SQL Assistant

Модул 2: Въведение в SQL в Teradata

  • Основен SELECT, WHERE, ORDER BY
  • Типове данни и преобразуване (casting)
  • Математически и датови функции
  • Използване на ALIAS, изрази CASE
  • Специални оператори на Teradata (TOP, QUALIFY, SAMPLE)
  • Упражнения с упътване: заявки в реални таблици

Модул 3: Joins, Subqueries и Set Operators

  • INNER, LEFT, RIGHT, FULL OUTER JOIN
  • Joins без клauза ON (картински произведение)
  • Скаларни и корелационни подзаявки
  • UNION, INTERSECT, MINUS
  • Практически упражнения за интегриране на данни

Модул 4: Аналитични функции и OLAP

  • RANK(), ROW_NUMBER(), DENSE_RANK()
  • Разделение на данни с PARTITION BY
  • Прозорци с OVER() и ORDER BY
  • LAG(), LEAD(), FIRST_VALUE()
  • Практически случаи: KPIs, тенденции, акумулации

Модул 5: Управление на данни и таблиците

  • Типове таблици: постоянни, превременни, глобално временни
  • Създаване и използване на вторични индекси и join indexes
  • Вмъкване, актуализация и изтриване на записи
  • MERGE, UPSERT и контрол на дублиранията
  • Транзакции и управление на locks

Модул 6: Оптимизация и подобряване на производителността

  • Оптимизаторът на Teradata: как се решава за плановете
  • Използване на EXPLAIN и COLLECT STATISTICS
  • Скев (skew) и как да се избегне
  • Най-добри практики за проектирането на заявки
  • Идентифициране на узки места (spool, locks, преразпределение)
  • Практика: сравнение между оптимизирани и неоптимизирани заявки

Модул 7: Партициониране и компресия на данни

  • Типове партициониране: Range, Case, Multi-Level
  • Практически предимства и използване в големи заявки
  • Компресия на ниво блок (BLC) и колонна компресия
  • Предимства и ограничения

Модул 8: Зареждане и извличане на данни

  • TPT (Teradata Parallel Transporter) спрямо FastLoad / MultiLoad
  • Масово зареждане спрямо батч вмъкване
  • Обработка на грешки и повторни опити
  • Експортиране на резултатите във файлове или извън системата
  • Основна автоматизация с скриптове и утилити

Модул 9: Основно управление за технически потребители

  • Роли и права
  • Управление на ресурси (Query Bands, Priority Scheduler)
  • Мониторинг с DBQLOGTBL, DBC.Tables, ResUsage
  • Най-добри практики за споделени среди

Модул 10: Крайно интеграционно лабораторно упражнение

  • Практически случай от край до край:
    • Зареждане на данни
    • Трансформация и агрегиране
    • Построяване на индикатори с аналитични функции
    • Оптимизация и обяснение
    • Крайно експортиране
  • Обсъждане на най-добри практики и често срещани грешки

Изисквания

  • Разбиране на релационните бази данни и концепцията SQL
  • Опит с изпълняване на заявки към голями набори от данни или работа в околната среда за данни
  • Запознаност с цели и задачи в бизнес-интелигентността или аналитиката

Публика

  • Аналисти на данни и професионалисти в бизнес-интелигентността
  • Разработчици SQL и инженери по данни
  • Технически потребители, които управляват или оптимизират данните в околната среда Teradata
 35 часа

Брой участници


Цена за участник

Отзиви от потребители (1)

Предстоящи Курсове

Свързани Kатегории