Thank you for sending your enquiry! One of our team member will contact you shortly.
Thank you for sending your booking! One of our team member will contact you shortly.
План на курса
Въведение
Reinforcement Learning Основи
Основни Reinforcement Learning техники
Въведение в чул
Конвергенция на стойността и итерация на политиката
Оформяне на наградата
Проучване
Обобщение
Частично наблюдавани MDP
Настроики
Логистиката
TD Lambda
Политически градиенти
Дълбоко Q-обучение
Теми по теория на игрите
Обобщение и следващи стъпки
Изисквания
- Владеене на Python
- Разбиране на математиката и линейната алгебра в колежа
- Основно разбиране на вероятността и Statistics
- Опит в създаването на модели за машинно обучение в Python и Numpy
Публика
- Разработчици
- Учени по данни
21 Hours