План на курса

Въведение в обучението на роботи

  • Обзор на машинното обучение в роботиката
  • Надзирани, безнадзирани и учене с подкрепа
  • Приложения на RL в контрол, навигация и манипулация

Основи на обучението с подкрепа

  • Марковски процеси на взимане на решения (MDP)
  • Политики, функции на стойности и награди
  • Баланс между изследване и експлоатация

Класически алгоритми за RL

  • Q-учене и SARSA
  • Методи на Монте Карло и времево разлика
  • Итерации на стойности и политики

Техники за глъбоко обучение с подкрепа

  • Комбиниране на глъбоко обучение и RL (Deep Q-Networks)
  • Методи на градиент на политики
  • Продвинати алгоритми: A3C, DDPG и PPO

Симулиращи среди за обучение на роботи

  • Използване на OpenAI Gym и ROS 2 за симуляции
  • Построяване на персонализирани среди за роботни задачи
  • Оценка на производителността и стабилността при обучение

Применяване на RL в роботика

  • Учене на контролни и движителни политики
  • Реинфорсмънт лърнинг за манипулиране с роботи
  • Многоагентно обучение с подкрепа в роялна роботика

Оптимизация, разпространяване и интеграция в реалния свят

  • Тюнинг на хиперпараметри и формиране на награди
  • Преместване на научени политики от симуляция към реален свят (Sim2Real)
  • Разпространяване на обучените модели в роботни хардвари

Обобщение и следващи стъпки

Изисквания

  • Разбиране на концепциите за машинно обучение
  • Опит с програмирането на Python
  • Запознаност с роботика и контролни системи

Целева аудитория

  • Машинни инженери
  • Изследователи по роботика
  • Разработчици, които изграждат умни роботни системи
 21 часа

Брой участници


Цена за участник

Отзиви от потребители (1)

Предстоящи Курсове

Свързани Kатегории