План на курса

Основи на безопасен и справеден AI

  • Основни концепции: безопасност, предразсъдък, справедливост, прозрачност
  • Видове предразсъдъци: набор от данни, представяне, алгоритмичен
  • Обзор на регулаторните рамки (Закон за AI на ЕС, GDPR и т.н.)

Предразсъдъци в настройвани модели

  • Как настройването може да въведе или увеличи предразсъдъците
  • Примерни изследвания и реални провали
  • Определяне на предразсъдъците в наборите от данни и прогнозите на моделите

Техники за намаляване на предразсъдъците

  • Стратегии на ниво данни (пребалансиране, увереждение)
  • Стратегии през процеса на обучение (регуларизация, антагонистично намаляване на предразсъдъците)
  • Стратегии за постобработка (филтриране на изходи, калибровка)

Безопасност и устойчивост на моделите

  • Определяне на небезопасни или вредни изходи
  • Работа с антагонистични входни данни
  • Тестване и стрес тестване на настройвани модели

Аудит и мониторинг на системи за AI

  • Метрики за оценка на предразсъдъци и справедливост (например, демографска паритет)
  • Инструменти за обяснение и прозрачни рамки
  • Продължаващ мониторинг и практики за управление

Инструменти и практически упражнения

  • Използване на отворени библиотеки (например, Fairlearn, Transformers, CheckList)
  • Практически: определяне и намаляване на предразсъдъците в настройван модел
  • Генериране на безопасни изходи чрез дизайн на подсказки и ограничения

Практически случаи в корпоративната среда и подготовка за съответствие

  • Най-добра практика за интегриране на безопасност в процесите на LLM
  • Документация и карти на модели за съответствие
  • Подготовка за аудити и външни прегледи

Резюме и следващи стъпки

Изисквания

  • Разбиране на модели за машинно обучение и процеси за обучение
  • Опит в работа с подгонка и големи модели за езика
  • Знание на Python и концепции за обработка на естествен език

Целева аудитория

  • Екипи за съответствие на AI
  • Инженери за машинно обучение
 14 часа

Брой участници


Цена за участник

Предстоящи Курсове

Свързани Kатегории