План на курса

Въведение в архитектурата на Biren GPU

  • Обзор на Biren и приложения
  • Хардуерна структура: ядра, памет, изчислителни кластери
  • Сравнение с NVIDIA и AMD GPUs

Настройка на средата на Biren Programming

  • Инсталиране на Biren SDK и изпълнителна среда
  • Разбиране на инструменталния комплекс и модела на компилатора
  • Основна структура на проекта и процес на построяване

GPU Programming с Biren стека

  • Модели на нишки и блокове
  • Управление на паметта и пренос на данни
  • Разработка на ядра и шаблони за запуск

Превключване от CUDA към Biren

  • Техники за превод на CUDA код
  • Обикновени API карти и адаптации
  • Лаборатории за преобразуване на код и практика

Отстраняване на грешки и профилиране

  • Използване на отстранителът на грешки и профилиращия инструмент на Biren
  • Идентифициране на узки места
  • Модели за достъп до паметта и оптимизация

Техники за оптимизация

  • Разписване на нишки и инструкционна конвейеризация
  • Развиване на цикъл и използване на обща памет
  • Надграждане на ядра за проходност

Примерен случай и примери за приложение

  • Обучение на модел с акселератори на Biren
  • Превключване и профилиране на модел за зрение или обработка на естествен език
  • Сравнение на производителността с CUDA/NVIDIA

Резюме и следващи стъпки

Изисквания

  • Разбиране на архитектура и паралелно обработване
  • Опит с CUDA, OpenCL, или подобни GPU среди за програмиране
  • Запознатост с рамочници за дълбоко обучение, като PyTorch или TensorFlow

Целева аудитория

  • Разработчици на HPC
  • Инженери на AI инфраструктура
  • Специалисти по оптимизация на производителност
 21 часа

Брой участници


Цена за участник

Отзиви от потребители (1)

Предстоящи Курсове

Свързани Kатегории