План на курса

Въведение в AIOps с отворен код инструменти

  • Общ преглед на концепциите и предимствата на AIOps
  • Prometheus и Grafana в стек за наблюдаемост
  • Как ML се интегрира в AIOps: предиктивна vs. реактивна аналитика

Настройка на Prometheus и Grafana

  • Инсталиране и конфигуриране на Prometheus за събиране на временни редове
  • Създаване на панели в Grafana с използване на реални временни метрики
  • Разглеждане на експортьори, преименуване и откриване на услуги

Предварителна обработка на данни за ML

  • Извличане и трансформация на метриките на Prometheus
  • Подготовка на данни за откриване на аномалии и прогнозиране
  • Използване на трансформациите на Grafana или Python пиплайни

Прилагане на машинно обучение за откриване на аномалии

  • Основни ML модели за откриване на изключения (например, Isolation Forest, One-Class SVM)
  • Обучение и оценка на модели върху временни редове данни
  • Визуализация на аномалии в панелите на Grafana

Прогнозиране на метрики с ML

  • Създаване на прости модели за прогнозиране (ARIMA, Prophet, въведение в LSTM)
  • Прогнозиране на натоварване на системата или използване на ресурси
  • Използване на прогнози за ранни предупреждения и решения за масштабиране

Интегриране на ML с уведомления и автоматизация

  • Определяне на правила за уведомления, базирани на изход от ML или прагове
  • Използване на Alertmanager и маршрутиране на уведомления
  • Запускане на скриптове или автоматизирани процеси при откриване на аномалии

Масштабиране и операционализация на AIOps

  • Интегриране на външни инструменти за наблюдаемост (например, ELK стек, Moogsoft, Dynatrace)
  • Операционализация на ML модели в пайплайни за наблюдаемост
  • Най-добри практики за масштабиране на AIOps

Резюме и следващи стъпки

Изисквания

  • Разбиране в концепции за мониторинг на системи и наблюдателност
  • Опит с работа с Grafana или Prometheus
  • За известност с Python и основни принципи на машинно обучение

Целева аудитория

  • Инженери за наблюдателност
  • Екипи за инфраструктура и DevOps
  • Архитекти на платформи за мониторинг и инженери за сигурност на сайта (SREs)
 14 часа

Брой участници


Цена за участник

Предстоящи Курсове

Свързани Kатегории