План на курса

Въведение

    Решаване на проблеми от реалния свят чрез взаимодействие на метода проба-грешка

Разбиране на системите за адаптивно обучение и Artificial Intelligence (AI).

Как агентите възприемат държавата

Как да възнаградите агент

Казус от практиката: Взаимодействие с посетителите на уебсайта

Подготовка на средата за агента

Задълбочено потапяне в Reinforcement Learning алгоритми

Методи, базирани на стойности срещу методи, базирани на политики

Избор на Reinforcement Learning модел

Използване на алгоритъма без модел на Q-Learning Reinforcement Learning.

Проектиране на агента

Казус от практиката: Интелигентни асистенти

Взаимодействие на агента с производствена среда

Измерване на резултатите от действията на агента

Отстраняване на неизправности

Обобщение и заключение

Изисквания

  • Общо разбиране на ученето с подсилване
  • Опит с машинно обучение
  • Java опит в програмирането

Публика

  • Учени по данни
  21 Hours
 

Брой участници


Започва

Свършва


Dates are subject to availability and take place between 09:30 and 16:30.
Open Training Courses require 5+ participants.

Oтзиви от потребители (4)

Свързани Kурсове

Свързани Kатегории