План на курса

Въведение в Reinforcement Learning

  • Преглед на ученето с подсилване и неговите приложения
  • Разлики между контролирано, неконтролирано и обучение с подсилване
  • Ключови понятия: агент, среда, награди и политика

Процеси на вземане на решения по Марков (MDP)

  • Разбиране на състояния, действия, награди и преходи на състояния
  • Стойностни функции и уравнението на Белман
  • Динамично програмиране за решаване на MDP

Основни RL алгоритми

  • Таблични методи: Q-Learning и SARSA
  • Методи, базирани на политики: алгоритъм REINFORCE
  • Рамки актьор-критик и техните приложения

дълбоко Reinforcement Learning

  • Въведение в дълбоките Q-мрежи (DQN)
  • Изживейте преиграване и целеви мрежи
  • Политически градиенти и усъвършенствани дълбоки RL методи

RL рамки и инструменти

  • Въведение в OpenAI Gym и други RL среди
  • Използване на PyTorch или TensorFlow за разработване на RL модел
  • Обучение, тестване и сравнителен анализ на RL агенти

Предизвикателства в RL

  • Балансиране на изследването и експлоатацията в обучението
  • Справяне с оскъдни възнаграждения и проблеми с присвояването на кредити
  • Scalaспособност и изчислителни предизвикателства в RL

Практически Activities

  • Внедряване на Q-Learning и SARSA алгоритми от нулата
  • Обучение на базиран на DQN агент да играе проста игра в OpenAI Gym
  • Фина настройка на RL моделите за подобрена производителност в персонализирани среди

Обобщение и следващи стъпки

Изисквания

  • Силно разбиране на принципите и алгоритмите на машинното обучение
  • Владеене на Python програмиране
  • Познаване на невронни мрежи и рамки за дълбоко обучение

Публика

  • Инженери по машинно обучение
  • AI специалисти
 14 Часа

Брой участници


Цена за участник

Предстоящи Курсове

Свързани Kатегории