План на курса

Архитектура на Greenplum

  • Паралелна обработка и симетрична мултипроцесорна обработка
  • Роли на сегментите и конфигурация на кластера
  • Мащабираемост и преместване на данни
  • Архитектура на хранилището за данни Greenplum Data Warehouse

Структури на таблиците в Greenplum

  • Разпределени срещу случайно назначени таблици
  • Таблици от тип купа срещу таблици само за добавяне
  • Формати за съхранение на редове срещу колони
  • Разделени и кластерирани таблици

Разпределение на данни и хеширане

  • Логика за хеширане и ключове за разпределение
  • Управление на наклона и въздействие върху производителността
  • Хеш карти и стратегии за разположение на редове

Индекси и оптимизация на производителността

  • Кластерирани и некластерирани индекси
  • Приложения на B-tree и bitmap индекси
  • Сканиране на индекси и поведение при съхранение

Физичен дизайн на базата данни

  • Нормализация и проектиране на логическа модель
  • Стратегии за достъп на потребителите и анализ на разпределението
  • Демографски данни и решения за индексиране

Техники за денормализация

  • Изводени данни, сумарни таблици и предварителни съединявания
  • Колонни таблици като вертикално разделяне
  • Мартове за данни и материализирани видове

Напредни SQL и изпълнение на запитвания

  • Стратегии за съединяване и преразпределение
  • OLAP и прозорчеви функции
  • Временни таблици, подзапитвания и изведени таблици

Плани на EXPLAIN и настройка на запитвания

  • Четене и интерпретиране на изход от EXPLAIN
  • Анализ на стоимостите и оптимизация на плана
  • Преместване на съединители и операции на сегментно ниво

Инструменти на Greenplum и най-добри практики

  • ANALYZE и VACUUM
  • Зареждане и преместване на данни с Nexus
  • Сигурност, разрешения и съвети за производителност

Резюме и следващи стъпки

Изисквания

  • Разбиране на релационни бази данни и SQL
  • Опит с управление на хранилища на данни или аналитични системи
  • Знание на операции с командния ред на Linux

Целева аудитория

  • Архитекти и инженери на данни
  • Администратори на бази данни и технически ръководители
  • Разработчици на BI и специалисти по аналитика, работейки с Greenplum
 21 часа

Брой участници


Цена за участник

Отзиви от потребители (1)

Предстоящи Курсове

Свързани Kатегории