Благодарим ви, че изпратихте вашето запитване! Един от членовете на нашия екип ще се свърже с вас скоро.
Благодарим ви, че направихте своята резервация! Един от членовете на нашия екип ще се свърже с вас скоро.
План на курса
Конструиране на отворена архитектура AIOps
- Обзор на ключови компоненти в отворени пиплайни AIOps
- Поток на данни от влизане до уведомяване
- Сравнение на инструменти и стратегия за интеграция
Сбор и агрегация на данни
- Влизане на временни редове данни с Prometheus
- Записване на логи с Logstash и Beats
- Нормализиране на данни за кръстосана корелация на източници
Създаване на таблици за наблюдаемост
- Визуализация на метрики с Grafana
- Създаване на таблици Kibana за анализ на логи
- Използване на Elasticsearch запитвания за извличане на оперативни инсайти
Откриване на аномалии и предвиждане на инциденти
- Експортиране на данни за наблюдаемост към пиплайни Python
- Обучаване на ML модели за откриване на изключителни случаи и предвиждане
- Разработване на модели за живо извличане в пиплайна за наблюдаемост
Уведомяване и автоматизация с отворени инструменти
- Създаване на Prometheus правила за уведомяване и маршрутизация с Alertmanager
- Запускане на скриптове или API процеси за автоматичен отговор
- Използване на отворени оркестрационни инструменти (например, Ansible, Rundeck)
Разглеждане на интеграция и възможности за масштабиране
- Обработка на високообемно влизане и дългосрочно съхранение
- Сигурност и контрол на достъпа в отворени стекове
- Масштабиране на всеки слой независимо: влизане, обработка, уведомяване
Реални приложения и разширения
- Кейс студии: оптимизация на производителност, предотвратяване на изпадания и оптимизация на разходи
- Разширяване на пиплайни с инструменти за трасиране или графи на услуги
- Най-добри практики за изпълнение и поддръжка на AIOps в продукция
Резюме и следващи стъпки
Изисквания
- Опит с инструменти за наблюдаемост като Prometheus или ELK
- Работно знание на Python и основни принципи на машинно обучение
- Разбиране на ИТ операции и работети с алерти
Целева аудитория
- Продвинати инженери за натовареност на сайтове (SRE)
- Инженери за данни, работащи в операции
- DevOps лидери на платформи и архитекти на инфраструктура
14 Часа