Свържете се с нас

Съдържание и теми, включени в курса

Основи на безопасния и справедлив ИИ

  • Ключови понятия: безопасност, пристрастия, справедливост, прозрачност
  • Видове пристрастия: в данните, представителни, алгоритмични
  • Преглед на регулаторните рамки (Законодателен акт за ИИ на ЕС, GDPR и др.)

Пристрастия във фино настроените модели

  • Как финото настройване може да въведе или усили пристрастия
  • Казуси и реални неуспехи
  • Идентифициране на пристрастия в наборите от данни и прогнозите на моделите

Техники за смекчаване на пристрастията

  • Стратегии на ниво данни (ребалансиране, аугментация)
  • Стратегии по време на обучение (регуляризация, адверсариално дебайасиране)
  • Стратегии след обработка (филтриране на изходите, калибриране)

Безопасност и устойчивост на моделите

  • Откриване на небезопасни или вредни изходи
  • Справяне с адверсариални входни данни
  • Червен екип и стрес тестване на фино настроени модели

Одит и мониторинг на ИИ системи

  • Показатели за оценка на пристрастия и справедливост (напр. демографски паритет)
  • Инструменти за обяснимост и рамки за прозрачност
  • Текущо наблюдение и практики за управление

Инструменти и практическа работа

  • Използване на библиотеки с отворен код (напр. Fairlearn, Transformers, CheckList)
  • Практическо занятие: откриване и смекчаване на пристрастия във фино настроен модел
  • Генериране на безопасни резултати чрез дизайн на промптове и ограничения

Корпоративни приложения и готовност за съответствие

  • Най-добри практики за интегриране на безопасността в работните процеси с ГЕМ
  • Документация и моделни карти за съответствие
  • Подготовка за одити и външни проверки

Обобщение и следващи стъпки

Изисквания

  • Разбиране на моделите за машинно обучение и процесите на обучение
  • Опит в работа с фино настройване и големи езикови модели (LLM)
  • Познаване на Python и концепции от обработка на естествен език (NLP)

Аудитория

  • Екипи по съвместимост с ИИ
  • ML инженери
 14 Часа

Брой участници


Цена за участник

Предстоящи Курсове

Свързани Kатегории