План на курса

Въведение

    Решаване на проблеми от реалния свят чрез взаимодействие на метода проба-грешка

Разбиране на системите за адаптивно обучение и Artificial Intelligence (AI).

Как агентите възприемат държавата

Как да възнаградите агент

Казус от практиката: Взаимодействие с посетителите на уебсайта

Подготовка на средата за агента

Задълбочено потапяне в Reinforcement Learning алгоритми

Методи, базирани на стойности срещу методи, базирани на политики

Избор на Reinforcement Learning модел

Използване на алгоритъма без модел на Q-Learning Reinforcement Learning.

Проектиране на агента

Казус от практиката: Интелигентни асистенти

Взаимодействие на агента с производствена среда

Измерване на резултатите от действията на агента

Отстраняване на неизправности

Обобщение и заключение

Изисквания

  • Общо разбиране на ученето с подсилване
  • Опит с машинно обучение
  • Java опит в програмирането

Публика

  • Учени по данни
 21 Hours

Брой участници



Цена за участник

Oтзиви от потребители (4)

Свързани Kурсове

Свързани Kатегории