План на курса

Антипатерни в SRE

  • Идентифициране на контрапродуктивни практики
  • Разпознаване на влиянието на антипатерните върху надеждността
  • Най-добри практики и корективни алтернативи

SLO като заместител за удовлетвореност на клиентите

  • Определяне на Индикатори за нива на обслужване (SLIs) и Обективи за нива на обслужване (SLOs)
  • Управление на бюджета за грешки и балансиране на иновации с надеждност
  • Разбиране на ограниченията на разпределени системи

Създаване на сигурни и надеждни системи

  • Дизайн за отказоустойчивост и устойчивост
  • Интеграция на сигурност в инженерията на надеждност
  • Стратегии за масштабираност и защита на данни

Пълна наблюдаваемост на стека

  • Инструментиране и събиране на метрики
  • Разпределено трасиране и синтетично мониторинг
  • Разработка, водена от наблюдаваемост

Platform Engineering и AIOps

  • Платформено-центрирани инженерийни подходи
  • Автоматизация и оркестрация в SRE
  • Използване на DataOps и оперативна интелигенция

Инцидент Management в SRE

  • Роли и отговорности при реагиране на инциденти
  • Прилагане на рамки като OODA
  • Автоматично устраняване и разрешаване с помощта на AI/ML

Хаос инженерия

  • Принципи и стратегии за тестване на устойчивост
  • Планиране и изпълнение на упражнения „игрален ден“
  • Учене от контролирани експерименти с отказ

SRE като чист вид на DevOps

  • Интеграция на SRE в работите на DevOps
  • Културно съгласуване и практики за сътрудничество
  • Предприемане на организационни трансформации чрез SRE

Упражнения след клас

  • Студии на случаи с дизайн на големи системи
  • Сценарии за напреднало инструментиране и мониторинг
  • Реално решаване на проблеми с надеждност

Преглед и подготвка за изпит

  • Крайно преглеждане на силабуса на DevOps Institute SRE Practitioner
  • Примерни въпроси и пробни изпити
  • Стратегии и препоръки за изпит

Резюме и следващи стъпки

Изисквания

  • Разбиране на основните принципи на Site Reliability Engineering
  • Опит с практиките DevOps и свързаните инструменти
  • Знакомство със системно мониторинг, управление на инциденти и автоматизация

Целева аудитория

  • Специалисти по SRE, търсещи сертификат DevOps Institute SRE Practitioner
  • Инженери по DevOps, целящи да се развият в роли, ориентирани към надеждността
  • Лидери на операции, отговорни за стратегията и изпълнението на надеждността
 35 Часа

Брой участници


Цена за участник

Oтзиви от потребители (4)

Предстоящи Курсове

Свързани Kатегории