Свържете се с нас

Съдържание и теми, включени в курса

Архитектура на Greenplum

  • Паралелна обработка и симетрична многопроцесорна работа
  • Роли на сегментите и конфигурация на клъстера
  • Възможности за разширяване и придвижване на данни
  • Архитектура на склад за данни Greenplum

Таблични структури в Greenplum

  • Разпределени спрямо произволно присвоени таблици
  • Таблици с натрупване (heap) спрямо само за добавяне (append-only)
  • Формати за съхранение по редове спрямо колонно-ориентирани
  • Партиционирани и клъстеризирани таблици

Разпределение на данни и хеширане

  • Логика на хеширане и ключове за разпределение
  • Обработка на дисбаланс (skew) и влияние върху производителността
  • Хеш карти и стратегии за разполагане на редове

Индекси и оптимизация на производителността

  • Клъстеризирани и неклъстеризирани индекси
  • Случаи на употреба на B-tree и bitmap индекси
  • Поведение при сканиране на индекс и съхранение

Физически дизайн на база данни

  • Нормализация и проектиране на логически модел
  • Стратегии за достъп на потребители и анализ на разпределението
  • Демография на данните и решения за индексиране

Техники за денормализация

  • Извлечени данни, обобщени таблици и предварителни обединения (pre-joins)
  • Колонно-ориентирани таблици като вертикално партициониране
  • Витрини с данни (data marts) и материализирани изгледи

Разширен SQL и изпълнение на заявки

  • Стратегии за обединение (join) и преразпределение
  • OLAP и прозорчни функции
  • Временни таблици, подзаявки и извлечени таблици

EXPLAIN планове и настройка на заявки

  • Четене и интерпретиране на EXPLAIN изход
  • Анализ на разходите и оптимизация на план
  • Придвижване на обединения и локални за сегмента операции

Помощни програми на Greenplum и най-добри практики

  • ANALYZE и VACUUM
  • Зареждане и придвижване на данни с Nexus
  • Сигурност, права за достъп и съвети за производителност

Обобщение и следващи стъпки

Изисквания

  • Разбиране на релационни бази данни и SQL
  • Опит със съхранение на данни (data warehousing) или аналитични системи
  • Познаване на операциите с команден ред в Linux

Аудитория

  • Архитекти на данни и инженери
  • Администратори на бази данни и технически ръководители
  • BI разработчици и специалисти по анализ, работещи с Greenplum
 21 Часа

Брой участници


Цена за участник

Отзиви от участници (1)

Предстоящи Курсове

Свързани Kатегории