План на курса
Въведение
- Как SRE съединява традиционната IT и разработването на софтуер.
- Потребността от автоматизация и наблюдаемост.
- Ролята на софтуерните инженери спрямо администраторите на системи.
- Инженерите за надеждност на сайта (SRE) спрямо DevOps инженерите.
Общ преглед на IT система
- Архитектурата на системата, локално и в облака.
Общ преглед на принципите и практиките на SRE
- Инфраструктура като код.
- Ролята на контейнерирането и оркестрироването (Docker, Kubernetes и т.н.).
- Непрекъснатата интеграция, непрекъснатата доставка и непрекъснатото разглеждане.
- Наблюдаемост.
Оценяване на IT система
- Запазване на ресурсите на екипа и организацията.
- Картиране на системите и процесите.
- Оценка на потенциалното въздействие на SRE.
- Ролята на екипа за разработване на софтуер.
- Ролята на операционния екип.
- Ролята на управлението.
Поддържане на надеждността на система
- Описване и измерване на желаемата надеждност на услугата.
- Разбиране на целите за нивото на услугата (SLO).
- Разбиране на индикаторите за нивото на услугата (SLI) и споразуменията за нивото на услугата (SLA).
- Работа с бюджети за грешки.
- Разработка на SLO.
Оптимизиране на администраторските задачи
- Създаване на разработка среда.
- Оценка на инструментите за SRE.
- Приоритизиране на задачи за автоматизация.
- Писане на софтуер.
Разполагане с "Инфраструктура като код"
- Тестване и итерация на кода.
- Направяне на система анти-fragile (анти-хрупка).
- Учение от неуспехите.
Мониторинг на система
- Наблюдение на производителността на системата.
- Инструменти и техники за SRE.
Будещето на SRE
Резюме и заключение
Изисквания
- Общо представа за IT инфраструктурата.
- Обща идея за процеса на разработване на софтуер.
- Опит с програмиране или скриптове във всяка език.
Аудитория
- Разработчици
- Администратори на системи
- Софтуерни архитекти
- DevOps инженери
- Управители на IT
Отзиви от потребители (7)
How detailed subjects are explained with real world examples
Brian Hlabane - African Bank
Курс - Site Reliability Engineering (SRE) Fundamentals
She is expert in area and provide really nice training. Material, training was really mix of examples , discussion and
Peter Tutka - Deutsche Telekom IT & Telecommunications Slovakia s.r.o.
Курс - Site Reliability Engineering (SRE) Fundamentals
View on the SRE/ DevOps from more business/ theoretical point of view. Most helpful for people who already have the practical view.
Michael Varhol - Deutsche Telekom IT & Telecommunications Slovakia s.r.o.
Курс - Site Reliability Engineering (SRE) Fundamentals
Approach of the training to send questionnaire before the training, so the training was planned accordingly to expectations. Brings the participants more active.
Stefan Girman - Deutsche Telekom IT & Telecommunications Slovakia s.r.o.
Курс - Site Reliability Engineering (SRE) Fundamentals
Sticking to the initial survey from attendees about what should be the focus of training.
Denis Majorsky - Deutsche Telekom IT & Telecommunications Slovakia s.r.o.
Курс - Site Reliability Engineering (SRE) Fundamentals
discussions , SRE definition
Daniel Horvath - Deutsche Telekom IT & Telecommunications Slovakia s.r.o.
Курс - Site Reliability Engineering (SRE) Fundamentals
Concept of the training, keeping the people focused by asking them a questions and triggering discussions. Also group breakout sessions were great to think about things in groups and see different outcomes from other group.