План на курса

Въведение

Reinforcement Learning Основи

Основни Reinforcement Learning техники

Въведение в чул

Конвергенция на стойността и итерация на политиката

Оформяне на наградата

Проучване

Обобщение

Частично наблюдавани MDP

Настроики

Логистиката

TD Lambda

Политически градиенти

Дълбоко Q-обучение

Теми по теория на игрите

Обобщение и следващи стъпки

Изисквания

  • Владеене на Python
  • Разбиране на математиката и линейната алгебра в колежа
  • Основно разбиране на вероятността и Statistics
  • Опит в създаването на модели за машинно обучение в Python и Numpy

Публика

  • Разработчици
  • Учени по данни
 21 Hours

Брой участници



Цена за участник

Свързани Kурсове

Advanced Stable Diffusion: Deep Learning for Text-to-Image Generation

21 Hours

Свързани Kатегории