План на курса
Основи на агентните системи в продуктна среда
- Агентни архитектури: цикли, инструменти, памет и слоеве за оркестриране
- Животен цикъл на агентите: разработка, разпространение и непрекъснато функциониране
- Предизвикателства при управлението на агенти в продуктна мащаба
Инфраструктура и модели за разпространение
- Разпространяване на агенти в контейнеризирани и обlacни среди
- Масштабиращи модели: хоризонтален vs вертикално маскироване, конкуренция и ограничаване на скоростта
- Оркестриране с много агенти и балансиране на работната зареда
Мониторинг и наблюдаемост
- Ключови метрики: латентност, успех, използване на памет и дълбочина на виканията на агента
- Трасиране на активността и графите на виканията на агентите
- Инструментиране за наблюдаемост с Prometheus, OpenTelemetry и Grafana
Логване, аудит и комплаенс
- Централизирано логване и структурирана колекция на събития
- Комплаенс и аудитабилност в агентни работни процеси
- Проектиране на аудитни пътеки и механизми за повторяване за отстраняване на грешки
Подобряване на производителността и оптимизация на ресурсите
- Съкращаване на разходите за извършване и оптимизация на циклите на оркестрирането на агенти
- Кеширане на модели и лекото вграждане за по бързо извличане
- Нагрузително тестиране и стрес сценарии за ИИ канали
Контрол на разходите и управление
- Разбиране на драйверите на разходите за агенти: API викания, памет, изчислителни ресурси и външни интеграции
- Отслежване на разходите на ниво агент и имплементация на модели за облагане с данъци
- Политики за автоматизация, за да се предотврати распространението на агенти и използването на покойни ресурси
Стратегии за CI/CD и разпространение на агенти
- Интегриране на канали на агенти в системите CI/CD
- Тестове, версиониране и стратегии за откъсване при итеративни актуализации на агенти
- Постепените разпространения и безопасни механизми за разпространение
Възстановяване при събуждания и инженеринг на надеждността
- Проектиране за толерантност към събуждания и градивна деградация
- Модели за опит, изтекло време и прекъсване на циклите за надеждността на агенти
- Рамки за отговор при инциденти и по-мъртвите анализи за операции с ИИ
Ключов проект
- Проектирайте и разпространете агентна ИИ система с пълно наблюдение и отслежване на разходите
- Симулирайте нагрузка, измерете производителността и оптимизирайте използването на ресурсите
- Представете крайната архитектура и панел за наблюдение на колеги
Резюме и следващи стъпки
Изисквания
- Добре разбиране на MLOps и продуктни машинни обучения
- Опит с контейнеризирани разпространения (Docker/Kubernetes)
- Знайки на облака за оптимизация на разходите и инструменти за наблюдаемост
Публика
- Инженери в MLOps
- Инженери за надеждност на сайта (SREs)
- Мениджъри на инженерия, които наблюдават ИИ инфраструктура
Отзиви от потребители (3)
Добра смесица от знания и практика
Ion Mironescu - Facultatea S.A.I.A.P.M.
Курс - Agentic AI for Enterprise Applications
Машинен превод
Смесицата между теорията и практиката, както и между високо и ниско ниво перспективи.
Ion Mironescu - Facultatea S.A.I.A.P.M.
Курс - Autonomous Decision-Making with Agentic AI
Машинен превод
практическа упражнение
Daniel - Facultatea S.A.I.A.P.M.
Курс - Agentic AI in Multi-Agent Systems
Машинен превод