План на курса
SRE Антипатерни
- Идентифициране на контрпродуктивни практики
- Разпознаване на влиянието на антипатерните върху надеждността
- Лучши практики и коригиращи альтернативи
SLO като прокси за удовлетвореност на клиентите
- Определяне на индикатори за ниво на обслужване (SLI) и цели за ниво на обслужване (SLO)
- Управление на бюджетите за грешки и балансиране между иновации и надеждност
- Разбиране на границите на разпределените системи
Проектиране на сигурни и надеждни системи
- Проектиране с толеранция към дефекти и устойчивост
- Интегриране на сигурност в инженерията за надеждност
- Стратегии за масштабиране и защита на данните
Пълен набор от наблюдения
- Инструментализация и събиране на метрики
- Разпределено проследяване и синтетичен мониторинг
- Наблюдение-директно развитие
Инженерия на платформи и AIOps
- Подходи към инженерия, центрирани около платформите
- Автоматизация и управление в SRE
- Използване на DataOps и операционна разузнаваност
Управление на инциденти в SRE
- Роли и отговорности при реагиране на инциденти
- Применение на фреймворки като OODA
- Автоматизирано коригиране и разрешаване с помощта на AI/ML
Хаос инженерия
- Принципи и стратегии за тестове на устойчивост
- Планиране и изпълнение на „игрови дни“
- Учение от контролирани експерименти с неуспешности
SRE като чиста форма на DevOps
- Интегриране на SRE в рабочите процеси на DevOps
- Културно подравняване и практики за сътрудничество
- Подстъпка за организационна трансформация чрез SRE
Упражнения след курса
- Кейсови студии за проектиране на голямо мащабно системи
- Напреднали сценарии за инструментализация и мониторинг
- Решаване на реални проблеми с надеждност
Ревю и подготовка за изпита
- Конечен ревю на програмата за сертификация на практиканти по SRE от DevOps Institute
- Примерни въпроси и тестове за практика
- Стратегии и препоръки за изпит
Резюме и следващи стъпки
Изисквания
- Разбиране на основните принципи на Site Reliability Engineering
- Опит с практики и свързани инструменти в DevOps
- Запознаност с мониторинг на системата, управление на инциденти и автоматизация
Целева група
- Професионалисти в SRE, търсещи сертификация на практиканти по SRE от DevOps Institute
- Инженери в DevOps, които стремят да се развиват в ролята на надеждност
- Ръководители на операции, отговорни за стратегия и изпълнение на политика за надеждност
Отзиви от потребители (5)
Високо ниво на ангажимент и знания на треньора
Jacek - Softsystem
Курс - DevOps Engineering Foundation (DOEF)®
Машинен превод
Разбивката на това, което DevOps може да направи. Възможна автоматизирана интеграция.
Adeyinka Adekoya - NTPF
Курс - Continuous Testing Foundation (CTF)®
Машинен превод
работа с DevOps Toolchain
Kesh - Vodacom
Курс - DevOps Foundation®
Машинен превод
нова информация
Michael Durisin - Deutsche Telekom IT & Telecommunications Slovakia s.r.o
Курс - Site Reliability Engineering (SRE) Foundation®
Машинен превод
темата - SRE
Roman Lajs - Deutsche Telekom IT & Telecommunications Slovakia s.r.o.
Курс - Site Reliability Engineering (SRE) Fundamentals
Машинен превод