Съдържание и теми, включени в курса
Основи на агентни системи в продукционна среда
- Агентни архитектури: цикли, инструменти, памет и оркестрационни слоеве
- Жизнен цикъл на агентите: разработка, внедряване и непрекъсната експлоатация
- Предизвикателства пред управлението на агенти в продукционен мащаб
Инфраструктура и модели на внедряване
- Внедряване на агенти в контейнеризирани и облачни среди
- Модели на мащабиране: хоризонтално спрямо вертикално мащабиране, паралелност и ограничаване
- Оркестрация на множество агенти и балансиране на натоварването
Мониторинг и наблюдаемост
- Ключови метрики: латентност, успеваемост, използване на памет и дълбочина на агентните заявки
- Проследяване на агентната активност и графи на заявките
- Инструментиране на наблюдаемост с Prometheus, OpenTelemetry и Grafana
Логиране, одит и съответствие
- Централизирано логиране и структурирано събиране на събития
- Съответствие и възможност за одит в агентни работни потоци
- Проектиране на одитни следи и механизми за възпроизвеждане с цел отстраняване на грешки
Настройка на производителността и оптимизация на ресурсите
- Намаляване на извършването на изводи и оптимизиране на циклите на агентна оркестрация
- Кеширане на модели и леки вграждания (ембединги) за по-бързо извличане
- Тестване под натоварване и стресови сценарии за AI потоци
Контрол на разходите и управление
- Разбиране на факторите за разход при агентите: API заявки, памет, изчисления и външни интеграции
- Проследяване на разходите на ниво агент и внедряване на модели за обратно начисляване
- Политики за автоматизация за предотвратяване на разрастване на агентите и потребление на неактивни ресурси
CI/CD и стратегии за пускане на агенти
- Интегриране на агентни потоци в CI/CD системи
- Тестване, версиониране и стратегии за връщане назад при итеративни актуализации на агенти
- Прогресивни пускания и безопасни механизми за внедряване
Възстановяване от откази и инженерство по надеждност
- Проектиране с оглед толерантност към откази и постепенна деградация
- Модели за повторен опит, таймаут и прекъсвач на верига за надеждност на агентите
- Реагиране при инциденти и рамки за посмъртен анализ при AI операции
Капстон проект
- Изграждане и внедряване на агентна AI система с пълен мониторинг и проследяване на разходите
- Симулиране на натоварване, измерване на производителността и оптимизиране на използването на ресурси
- Представяне на финалната архитектура и мониторинг табло пред колегите
Обобщение и следващи стъпки
Изисквания
- Силно разбиране на MLOps и продукционни системи за машинно обучение
- Опит с контейнеризирани внедрявания (Docker/Kubernetes)
- Познаване на инструменти за оптимизация на облачни разходи и наблюдаемост
Аудитория
- MLOps инженери
- Инженери по надеждност на сайтове (Site Reliability Engineers - SREs)
- Инженерни мениджъри, надзираващи AI инфраструктура
Отзиви от участници (3)
Тренерът е търпелив и много полезен. Той познава добре темата.
CLIFFORD TABARES - Universal Leaf Philippines, Inc.
Курс - Agentic AI for Business Automation: Use Cases & Integration
Машинен превод
Добра смес от знания и практика
Ion Mironescu - Facultatea S.A.I.A.P.M.
Курс - Agentic AI for Enterprise Applications
Машинен превод
Мистото на теорията и практиката, както и на високонивелните и нисконивелните перспективи
Ion Mironescu - Facultatea S.A.I.A.P.M.
Курс - Autonomous Decision-Making with Agentic AI
Машинен превод