План на курса

Основи на агентните системи в продуктна среда

  • Агентни архитектури: цикли, инструменти, памет и слоеве за оркестриране
  • Животен цикъл на агентите: разработка, разпространение и непрекъснато функциониране
  • Предизвикателства при управлението на агенти в продуктна мащаба

Инфраструктура и модели за разпространение

  • Разпространяване на агенти в контейнеризирани и обlacни среди
  • Масштабиращи модели: хоризонтален vs вертикално маскироване, конкуренция и ограничаване на скоростта
  • Оркестриране с много агенти и балансиране на работната зареда

Мониторинг и наблюдаемост

  • Ключови метрики: латентност, успех, използване на памет и дълбочина на виканията на агента
  • Трасиране на активността и графите на виканията на агентите
  • Инструментиране за наблюдаемост с Prometheus, OpenTelemetry и Grafana

Логване, аудит и комплаенс

  • Централизирано логване и структурирана колекция на събития
  • Комплаенс и аудитабилност в агентни работни процеси
  • Проектиране на аудитни пътеки и механизми за повторяване за отстраняване на грешки

Подобряване на производителността и оптимизация на ресурсите

  • Съкращаване на разходите за извършване и оптимизация на циклите на оркестрирането на агенти
  • Кеширане на модели и лекото вграждане за по бързо извличане
  • Нагрузително тестиране и стрес сценарии за ИИ канали

Контрол на разходите и управление

  • Разбиране на драйверите на разходите за агенти: API викания, памет, изчислителни ресурси и външни интеграции
  • Отслежване на разходите на ниво агент и имплементация на модели за облагане с данъци
  • Политики за автоматизация, за да се предотврати распространението на агенти и използването на покойни ресурси

Стратегии за CI/CD и разпространение на агенти

  • Интегриране на канали на агенти в системите CI/CD
  • Тестове, версиониране и стратегии за откъсване при итеративни актуализации на агенти
  • Постепените разпространения и безопасни механизми за разпространение

Възстановяване при събуждания и инженеринг на надеждността

  • Проектиране за толерантност към събуждания и градивна деградация
  • Модели за опит, изтекло време и прекъсване на циклите за надеждността на агенти
  • Рамки за отговор при инциденти и по-мъртвите анализи за операции с ИИ

Ключов проект

  • Проектирайте и разпространете агентна ИИ система с пълно наблюдение и отслежване на разходите
  • Симулирайте нагрузка, измерете производителността и оптимизирайте използването на ресурсите
  • Представете крайната архитектура и панел за наблюдение на колеги

Резюме и следващи стъпки

Изисквания

  • Добре разбиране на MLOps и продуктни машинни обучения
  • Опит с контейнеризирани разпространения (Docker/Kubernetes)
  • Знайки на облака за оптимизация на разходите и инструменти за наблюдаемост

Публика

  • Инженери в MLOps
  • Инженери за надеждност на сайта (SREs)
  • Мениджъри на инженерия, които наблюдават ИИ инфраструктура
 21 часа

Брой участници


Цена за участник

Отзиви от потребители (3)

Предстоящи Курсове

Свързани Kатегории