План на курса

Въведение

Reinforcement Learning Основи

Основни Reinforcement Learning техники

Въведение в чул

Конвергенция на стойността и итерация на политиката

Оформяне на наградата

Проучване

Обобщение

Частично наблюдавани MDP

Настроики

Логистиката

TD Lambda

Политически градиенти

Дълбоко Q-обучение

Теми по теория на игрите

Обобщение и следващи стъпки

Изисквания

  • Владеене на Python
  • Разбиране на математиката и линейната алгебра в колежа
  • Основно разбиране на вероятността и Statistics
  • Опит в създаването на модели за машинно обучение в Python и Numpy

Публика

  • Разработчици
  • Учени по данни
  21 Hours
 

Брой участници


Започва

Свършва


Dates are subject to availability and take place between 09:30 and 16:30.
Open Training Courses require 5+ participants.

Свързани Kурсове

Advanced Stable Diffusion: Deep Learning for Text-to-Image Generation

  21 Hours

Свързани Kатегории