Благодарим ви, че изпратихте вашето запитване! Един от членовете на нашия екип ще се свърже с вас скоро.
Благодарим ви, че направихте своята резервация! Един от членовете на нашия екип ще се свърже с вас скоро.
План на курса
Въведение в AIOps с отворен код инструменти
- Общ преглед на концепциите и предимствата на AIOps
- Prometheus и Grafana в стек за наблюдаемост
- Как ML се интегрира в AIOps: предиктивна vs. реактивна аналитика
Настройка на Prometheus и Grafana
- Инсталиране и конфигуриране на Prometheus за събиране на временни редове
- Създаване на панели в Grafana с използване на реални временни метрики
- Разглеждане на експортьори, преименуване и откриване на услуги
Предварителна обработка на данни за ML
- Извличане и трансформация на метриките на Prometheus
- Подготовка на данни за откриване на аномалии и прогнозиране
- Използване на трансформациите на Grafana или Python пиплайни
Прилагане на машинно обучение за откриване на аномалии
- Основни ML модели за откриване на изключения (например, Isolation Forest, One-Class SVM)
- Обучение и оценка на модели върху временни редове данни
- Визуализация на аномалии в панелите на Grafana
Прогнозиране на метрики с ML
- Създаване на прости модели за прогнозиране (ARIMA, Prophet, въведение в LSTM)
- Прогнозиране на натоварване на системата или използване на ресурси
- Използване на прогнози за ранни предупреждения и решения за масштабиране
Интегриране на ML с уведомления и автоматизация
- Определяне на правила за уведомления, базирани на изход от ML или прагове
- Използване на Alertmanager и маршрутиране на уведомления
- Запускане на скриптове или автоматизирани процеси при откриване на аномалии
Масштабиране и операционализация на AIOps
- Интегриране на външни инструменти за наблюдаемост (например, ELK стек, Moogsoft, Dynatrace)
- Операционализация на ML модели в пайплайни за наблюдаемост
- Най-добри практики за масштабиране на AIOps
Резюме и следващи стъпки
Изисквания
- Разбиране в концепции за мониторинг на системи и наблюдателност
- Опит с работа с Grafana или Prometheus
- За известност с Python и основни принципи на машинно обучение
Целева аудитория
- Инженери за наблюдателност
- Екипи за инфраструктура и DevOps
- Архитекти на платформи за мониторинг и инженери за сигурност на сайта (SREs)
14 часа