Свържете се с нас

Съдържание и теми, включени в курса

Подготовка на модели за машинно обучение за внедряване

  • Пакетиране на модели с Docker
  • Експортиране на модели от TensorFlow и PyTorch
  • Съображения относно версиониране и съхранение

Обслужване на модели в Kubernetes

  • Преглед на inference сървъри
  • Внедряване на TensorFlow Serving и TorchServe
  • Настройка на крайни точки за модели

Техники за оптимизация на изводи

  • Стратегии за пакетна обработка
  • Обработка на конкурентни заявки
  • Настройка на латентност и пропускателна способност

Автоматично мащабиране на ML работни натоварвания

  • Хоризонтален автоматичен мащабиращ механизъм за подове (HPA)
  • Вертикален автоматичен мащабиращ механизъм за подове (VPA)
  • Kubernetes Event-Driven Autoscaling (KEDA)

Осигуряване на GPU и управление на ресурси

  • Конфигуриране на GPU възли
  • Преглед на NVIDIA device plugin
  • Заявки за ресурси и лимити за ML работни натоварвания

Стратегии за внедряване и пускане на модели

  • Blue/green внедрявания
  • Canary модели на пускане
  • A/B тестване за оценка на модели

Мониторинг и наблюдаемост за ML в продукционна среда

  • Метрики за inference работни натоварвания
  • Практики за логване и проследяване
  • Табла и известяване

Сигурност и съображения за надеждност

  • Защита на крайни точки на модели
  • Мрежови политики и контрол на достъпа
  • Осигуряване на висока достъпност

Обобщение и следващи стъпки

Изисквания

  • Разбиране на работните потоци на контейнеризирани приложения
  • Опит с Python-базирани модели за машинно обучение
  • Запознатост с основите на Kubernetes

Аудитория

  • ML инженери
  • DevOps инженери
  • Екипи по платформено инженерство
 14 Часа

Брой участници


Цена за участник

Отзиви от участници (3)

Предстоящи Курсове

Свързани Kатегории