Свържете се с нас

Съдържание и теми, включени в курса

Основи на агентни системи в продукционна среда

  • Агентни архитектури: цикли, инструменти, памет и оркестрационни слоеве
  • Жизнен цикъл на агентите: разработка, внедряване и непрекъсната експлоатация
  • Предизвикателства пред управлението на агенти в продукционен мащаб

Инфраструктура и модели на внедряване

  • Внедряване на агенти в контейнеризирани и облачни среди
  • Модели на мащабиране: хоризонтално спрямо вертикално мащабиране, паралелност и ограничаване
  • Оркестрация на множество агенти и балансиране на натоварването

Мониторинг и наблюдаемост

  • Ключови метрики: латентност, успеваемост, използване на памет и дълбочина на агентните заявки
  • Проследяване на агентната активност и графи на заявките
  • Инструментиране на наблюдаемост с Prometheus, OpenTelemetry и Grafana

Логиране, одит и съответствие

  • Централизирано логиране и структурирано събиране на събития
  • Съответствие и възможност за одит в агентни работни потоци
  • Проектиране на одитни следи и механизми за възпроизвеждане с цел отстраняване на грешки

Настройка на производителността и оптимизация на ресурсите

  • Намаляване на извършването на изводи и оптимизиране на циклите на агентна оркестрация
  • Кеширане на модели и леки вграждания (ембединги) за по-бързо извличане
  • Тестване под натоварване и стресови сценарии за AI потоци

Контрол на разходите и управление

  • Разбиране на факторите за разход при агентите: API заявки, памет, изчисления и външни интеграции
  • Проследяване на разходите на ниво агент и внедряване на модели за обратно начисляване
  • Политики за автоматизация за предотвратяване на разрастване на агентите и потребление на неактивни ресурси

CI/CD и стратегии за пускане на агенти

  • Интегриране на агентни потоци в CI/CD системи
  • Тестване, версиониране и стратегии за връщане назад при итеративни актуализации на агенти
  • Прогресивни пускания и безопасни механизми за внедряване

Възстановяване от откази и инженерство по надеждност

  • Проектиране с оглед толерантност към откази и постепенна деградация
  • Модели за повторен опит, таймаут и прекъсвач на верига за надеждност на агентите
  • Реагиране при инциденти и рамки за посмъртен анализ при AI операции

Капстон проект

  • Изграждане и внедряване на агентна AI система с пълен мониторинг и проследяване на разходите
  • Симулиране на натоварване, измерване на производителността и оптимизиране на използването на ресурси
  • Представяне на финалната архитектура и мониторинг табло пред колегите

Обобщение и следващи стъпки

Изисквания

  • Силно разбиране на MLOps и продукционни системи за машинно обучение
  • Опит с контейнеризирани внедрявания (Docker/Kubernetes)
  • Познаване на инструменти за оптимизация на облачни разходи и наблюдаемост

Аудитория

  • MLOps инженери
  • Инженери по надеждност на сайтове (Site Reliability Engineers - SREs)
  • Инженерни мениджъри, надзираващи AI инфраструктура
 21 Часа

Брой участници


Цена за участник

Отзиви от участници (3)

Предстоящи Курсове

Свързани Kатегории