Благодарим ви, че изпратихте вашето запитване! Един от членовете на нашия екип ще се свърже с вас скоро.
Благодарим ви, че направихте своята резервация! Един от членовете на нашия екип ще се свърже с вас скоро.
Съдържание и теми, включени в курса
Проектиране на отворена AIOps архитектура
- Преглед на ключовите компоненти в отворените AIOps тръбопроводи
- Поток на данни от поглъщане до известяване
- Сравнение на инструменти и стратегия за интеграция
Събиране и агрегиране на данни
- Поглъщане на данни от времеви редове с Prometheus
- Улавяне на логове с Logstash и Beats
- Нормализиране на данни за корелация между източници
Изграждане на табла за наблюдаемост
- Визуализиране на метрики с Grafana
- Изграждане на Kibana табла за анализ на логове
- Използване на Elasticsearch заявки за извличане на оперативни прозрения
Откриване на аномалии и прогнозиране на инциденти
- Експортиране на данни за наблюдаемост към Python тръбопроводи
- Обучение на ML модели за откриване на отклонения и прогнозиране
- Внедряване на модели за инференция в реално време в тръбопровода за наблюдаемост
Известяване и автоматизация с отворени инструменти
- Създаване на правила за известяване в Prometheus и маршрутизиране чрез Alertmanager
- Задействане на скриптове или API работни потоци за автоматичен отговор
- Използване на оркестрационни инструменти с отворен код (напр. Ansible, Rundeck)
Съображения за интеграция и мащабируемост
- Обработка на поглъщане на голям обем данни и дългосрочно съхранение
- Сигурност и контрол на достъпа в стекове с отворен код
- Независимо мащабиране на всеки слой: поглъщане, обработка, известяване
Приложения в реалния свят и разширения
- Казуси: настройка на производителност, предотвратяване на престой и оптимизация на разходи
- Разширяване на тръбопроводи с инструменти за трасиране или графи на услуги
- Най-добри практики за изпълнение и поддръжка на AIOps в производствена среда
Обобщение и следващи стъпки
Изисквания
- Опит с инструменти за наблюдаемост като Prometheus или ELK
- Практически познания по Python и основи на машинното обучение
- Разбиране на ИТ операции и работни потоци за известяване
Аудитория
- Напреднали инженери по надеждност на сайтове (SREs)
- Инженери по данни, работещи в сферата на операциите
- Ръководители на DevOps платформи и инфраструктурни архитекти
14 Часа