План на курса

Въведение в архитектурата на Biren GPU

  • Преглед на Biren и примери за използване
  • Структура на оборудването: ядра, памет, компютърни кластери
  • Сравнение с NVIDIA и AMD GPUs

Настройка на средата на Biren Programming

  • Инсталиране на Biren SDK и runtime
  • Разбиране на инструменталната верига и модел на компилатора
  • Основна структура на проекта и процес на изграждане

GPU Programming с Biren Stack

  • Модели на нишки и блокове
  • Управление на паметта и прехвърляне на данни
  • Развитие на ядра и шаблони за пускане

Прехвърляне от CUDA към Biren

  • Техники за превод на CUDA код
  • Общи карти на API и адаптации
  • Лаборатории и практика за конверсия на код

Диагностика и профилиране

  • Използване на отладчика и профилатора на Biren
  • Идентифициране на бутилки на гърлото
  • Патрони на достъп до паметта и оптимизация

Техники за оптимизация

  • Разписване на нишки и pipeline на инструкции
  • Развъртяне на цикли и използване на споделена памет
  • Напреднала настройка на ядра за пропускателна способност

Примерен случай и примери за приложения

  • Обучение на модел с ускорители на Biren
  • Прехвърляне и профилиране на модел за зрение или NLP
  • Сравнение на производителността с CUDA/NVIDIA

Резюме и следващи стъпки

Изисквания

  • Разбиране на архитектурата на GPU и паралелното обработване
  • Опит с CUDA, OpenCL, или подобни GPU програмиращи среди
  • Знакомство с рамки за дълбоко обучение, като PyTorch или TensorFlow

Целева публика

  • Разработчици на HPC
  • Инженерi на AI инфраструктура
  • Специалисти по оптимизация на производителност
 21 Часа

Брой участници


Цена за участник

Oтзиви от потребители (1)

Предстоящи Курсове

Свързани Kатегории