Благодарим ви, че изпратихте вашето запитване! Един от членовете на нашия екип ще се свърже с вас скоро.
Благодарим ви, че направихте своята резервация! Един от членовете на нашия екип ще се свърже с вас скоро.
План на курса
Въведение в AIOps
- Какво е AIOps и защо то е важно
- Традиционен мониторинг срещу наблюдаемост, подкрепена от AIOps
- Архитектура на AIOps и ключовите компоненти
Събиране и Нормализация на Операционни Данни
- Видове данни за наблюдаемост: метрики, логове и следи
- Подаване на данни от различни източници (сървъри, контейнери, облак)
- Използване на агенти и експортиране (Prometheus, Beats, Fluentd)
Корелация на Данни и Детектация на Аномалии
- Корелация във времеви редове и статистически методи
- Използване на модели с машинно самообучаване за детектация на аномалии
- Детектиране на инциденти в разпределени системи
Сигнализация и Намаляване на Шум
- Проектиране на интелигентни правила за сигнализации и граници
- Подаване, дедупликация и групиране на сигнализации
- Интегриране с Alertmanager, Slack, PagerDuty или Opsgenie
Анализ и Визуализация на Коренни Причини
- Използване на таблици за визуализация на метрики и разпознаване на трендове
- Разглеждане на събития и времеви линии за анализ на коренни причини (RCA)
- Трояване на проблеми през слоевете с разпределени инструменти за тройване
Автоматизация и Ремедиация
- Активиране на автоматични скриптове или работен процес от инциденти
- Интегриране с ИТСМ системи (ServiceNow, Jira)
- Употребни случаи: самоизлековаване, мащабиране, пренасочване на трафик
Отворени Источни и Коммерсиални Платформи за AIOps
- Обзор на инструментите: Prometheus, Grafana, ELK, Moogsoft, Dynatrace
- Критерии за оценка при избор на платформа за AIOps
- Демонстрация и praktično упражнение с избран пакет
Резюме и Следващи Кораци
Изисквания
- Разбиране на концепциите за ИТ операции и мониторинг на системи
- Опит с инструменти за мониторинг или таблици
- Запознаност с основни формати на логове и метрики
Публика
- Операционни екипи, отговорни за инфраструктурата и приложенията
- Инженери по надеждност на сайта (SREs)
- Екипи за ИТ мониторинг и наблюдаемост
14 Часове