Курс за обучение по Програмиране на NVIDIA GPU - разширено
Този курс с преподавател на живо обхваща програмирането на графични процесори (GPU) за паралелни изчисления, използването на различни платформи, работата с платформата CUDA и нейните функции, както и прилагането на различни техники за оптимизация чрез CUDA. Сред приложенията са дълбоко обучение, анализ на данни, обработка на изображения и инженерни приложения.
Съдържание и теми, включени в курса
Въведение
Разбиране на основите на методологията за хетерогенни изчисления
Защо паралелни изчисления? Разбиране на необходимостта от паралелни изчисления
Многоядрени процесори - архитектура и дизайн
Въведение в нишките, основи на нишките и базови концепции на паралелното програмиране
Разбиране на основите на процесите за софтуерна оптимизация на GPU
OpenMP - стандарт за паралелно програмиране, базирано на директиви
Практически занятия / демонстрация на различни програми на многоядрени машини
Въведение в изчисленията с GPU
Графични процесори за паралелни изчисления
Програмен модел за GPU
Практически занятия / демонстрация на различни програми на GPU
SDK, инструментариум и инсталиране на среда за GPU
Работа с различни библиотеки
Демонстрация на GPU и инструменти с примерни програми и OpenACC
Разбиране на програмния модел CUDA
Изучаване на архитектурата CUDA
Проучване и настройка на средите за разработка с CUDA
Работа с API за изпълнение на CUDA
Разбиране на модела на паметта на CUDA
Проучване на допълнителни функции на API на CUDA
Ефективен достъп до глобалната памет в CUDA: оптимизация на глобалната памет
Оптимизиране на трансфера на данни в CUDA чрез CUDA потоци
Използване на споделена памет в CUDA
Разбиране и използване на атомарни операции и инструкции в CUDA
Казус: основна обработка на цифрови изображения с CUDA
Работа с многопроцесорно GPU програмиране
Разширено хардуерно профилиране и семплиране на NVIDIA / CUDA
Използване на API за динамичен паралелизъм на CUDA за динамично стартиране на ядра
Обобщение и заключение
Изисквания
- C програмиране
- Linux GCC
Отворените курсове за обучение изискват 5+ участника.
Курс за обучение по Програмиране на NVIDIA GPU - разширено - Резервация
Курс за обучение по Програмиране на NVIDIA GPU - разширено - Запитване
Програмиране на NVIDIA GPU - разширено - Консултантско запитване
Отзиви от участници (1)
Енергията и хуморът на тренерите.
Tadeusz Kaluba - Nokia Solutions and Networks Sp. z o.o.
Курс - NVIDIA GPU Programming - Extended
Машинен превод
Предстоящи Курсове
Свързани Kурсове
Разработка на AI приложения с Huawei Ascend и CANN
21 ЧасаHuawei Ascend е семейство от AI процесори, проектирани за високопроизводително инферентиране и обучение.
Това обучение с инструктор, провеждано на живо (онлайн или на място), е насочено към AI инженери и специалисти по обработка на данни от средно ниво, които желаят да разработват и оптимизират модели на невронни мрежи, използвайки платформата Huawei Ascend и инструментариума CANN.
До края на обучението участниците ще могат:
- Да настройват и конфигурират средата за разработка на CANN.
- Да разработват AI приложения, използвайки работни потоци на MindSpore и CloudMatrix.
- Да оптимизират производителността на Ascend NPU чрез персонализирани оператори и тайлинг.
- Да внедряват модели в ръбова или облачна среда.
Формат на обучението
- Интерактивна лекция и дискусия.
- Практическа работа с Huawei Ascend и инструментариума CANN в примерни приложения.
- Насочвани упражнения, фокусирани върху изграждане, обучение и внедряване на модели.
Опции за персонализиране на обучението
- За да заявите персонализирано обучение по този курс, съобразено с вашата инфраструктура или набори от данни, моля, свържете се с нас за уговаряне.
Внедряване на AI модели с CANN и Ascend AI процесори
14 ЧасаCANN (Compute Architecture for Neural Networks) е AI изчислителният стек на Huawei за внедряване и оптимизиране на AI модели върху Ascend AI процесори.
Това обучение с инструктор на живо (онлайн или на място) е насочено към AI разработчици и инженери на средно ниво, които искат да внедряват ефективно обучени AI модели върху хардуер на Huawei Ascend, използвайки инструментариума CANN и инструменти като MindSpore, TensorFlow или PyTorch.
До края на обучението участниците ще могат да:
- Разбират архитектурата на CANN и ролята ѝ в процеса на внедряване на AI.
- Конвертират и адаптират модели от популярни frameworks към формати, съвместими с Ascend.
- Използват инструменти като ATC, конвертиране на OM модели и MindSpore за инференция на периферни устройства и в облака.
- Диагностицират проблеми при внедряването и оптимизират производителността на хардуер Ascend.
Формат на курса
- Интерактивна лекция и демонстрация.
- Практическа лабораторна работа с CANN инструменти и Ascend симулатори или устройства.
- Сценарии за практическо внедряване, базирани на реални AI модели.
Опции за персонализиране на курса
- За да заявите персонализирано обучение за този курс, моля, свържете се с нас, за да го организираме.
AI изводи и внедряване с CloudMatrix
21 ЧасаCloudMatrix е унифицираната платформа на Huawei за разработка и внедряване на AI, проектирана да поддържа мащабируеми, производствени потоци за изводи.
Това обучение с инструктор на живо (онлайн или на място) е насочено към AI специалисти от начално до средно ниво, които желаят да внедряват и наблюдават AI модели с помощта на платформата CloudMatrix, интегрирана с CANN и MindSpore.
До края на това обучение участниците ще могат:
- Да използват CloudMatrix за пакетиране, внедряване и обслужване на модели.
- Да конвертират и оптимизират модели за чипсети Ascend.
- Да настройват потоци за задачи с изводи в реално време и на партиди.
- Да наблюдават внедряванията и да настройват производителността в производствени среди.
Формат на обучението
- Интерактивна лекция и дискусия.
- Практическо използване на CloudMatrix с реални сценарии за внедряване.
- Насочвани упражнения, фокусирани върху конвертиране, оптимизация и мащабиране.
Опции за персонализиране на обучението
- За да заявите персонализирано обучение по този курс, съобразено с вашата AI инфраструктура или облачна среда, моля, свържете се с нас за уговорка.
GPU програмиране на Biren AI ускорители
21 ЧасаBiren AI ускорителите са високопроизводителни GPU-та, проектирани за AI и HPC натоварвания с поддръжка на мащабно обучение и изводи.
Това обучение, водено от инструктор на живо (онлайн или на място), е насочено към разработчици от средно до напреднало ниво, които желаят да програмират и оптимизират приложения, използвайки собствения GPU стек на Biren, с практически сравнения с базирани на CUDA среди.
До края на това обучение участниците ще могат да:
- Разбират архитектурата на Biren GPU и йерархията на паметта.
- Настройват средата за разработка и използват програмния модел на Biren.
- Превеждат и оптимизират CUDA-подобен код за Biren платформи.
- Прилагат техники за настройка на производителността и отстраняване на грешки.
Формат на курса
- Интерактивна лекция и дискусия.
- Практическо използване на Biren SDK върху примерни GPU натоварвания.
- Ръководени упражнения, фокусирани върху пренасяне и настройка на производителността.
Опции за персонализиране на курса
- За да заявите персонализирано обучение за този курс, съобразено с вашия приложен стек или нужди за интеграция, моля, свържете се с нас, за да организираме.
Разработка за Cambricon MLU с BANGPy и Neuware
21 ЧасаCambricon MLU (Machine Learning Units) са специализирани AI чипове, оптимизирани за инференция и обучение в сценарии за крайни устройства и центрове за данни.
Това обучение с инструктор на живо (онлайн или присъствено) е насочено към разработчици на средно ниво, които желаят да изграждат и внедряват AI модели, използвайки рамката BANGPy и софтуерния пакет за разработка Neuware върху хардуер Cambricon MLU.
След завършване на обучението участниците ще могат да:
- Инсталират и конфигурират развойните среди на BANGPy и Neuware.
- Разработват и оптимизират базирани на Python и C++ модели за Cambricon MLU.
- Внедряват модели на крайни устройства и устройства в центрове за данни, работещи със среда за изпълнение Neuware.
- Интегрират работни потоци за машинно самообучение със специфични функции за ускорение на MLU.
Формат на курса
- Интерактивна лекция и дискусия.
- Практическа работа с BANGPy и Neuware за разработка и внедряване.
- Насочвани упражнения, фокусирани върху оптимизация, интеграция и тестване.
Опции за персонализиране на курса
- За да заявите персонализирано обучение по този курс, съобразено с вашия модел устройство Cambricon или случай на употреба, моля, свържете се с нас за уточняване.
Въведение в CANN за разработчици на AI рамки
7 ЧасаCANN (Compute Architecture for Neural Networks) е инструментариумът за AI изчисления на Huawei, използван за компилиране, оптимизиране и внедряване на AI модели върху процесори Ascend AI.
Това обучение с инструктор на живо (онлайн или на място) е насочено към начинаещи AI разработчици, които искат да разберат как CANN се вписва в жизнения цикъл на модела – от обучението до внедряването – и как работи с рамки като MindSpore, TensorFlow и PyTorch.
До края на обучението участниците ще могат да:
- Разбират целта и архитектурата на инструментариума CANN.
- Настройват среда за разработка с CANN и MindSpore.
- Конвертират и внедряват прост AI модел върху хардуер Ascend.
- Придобият основни познания за бъдещи проекти за оптимизация или интеграция на CANN.
Формат на курса
- Интерактивна лекция и дискусия.
- Практически лабораторни упражнения с внедряване на прост модел.
- Стъпка по стъпка разглеждане на инструменталната верига на CANN и точките на интеграция.
Опции за персонализиране на курса
- За да заявите персонализирано обучение за този курс, моля, свържете се с нас за уреждане.
CANN за внедряване на Edge AI
14 ЧасаИнструментариумът Ascend CANN на Huawei позволява мощен AI извод на крайни устройства като Ascend 310. CANN предоставя основни инструменти за компилиране, оптимизиране и внедряване на модели в среда с ограничени изчислителни ресурси и памет.
Това обучение с инструктор на живо (онлайн или на място) е насочено към AI разработчици и интегратори на средно ниво, които желаят да внедряват и оптимизират модели на крайни устройства Ascend, използвайки инструменталната верига CANN.
До края на това обучение участниците ще могат да:
- Подготвят и конвертират AI модели за Ascend 310, използвайки инструменти на CANN.
- Изграждат леки тръбопроводи за извод, използвайки MindSpore Lite и AscendCL.
- Оптимизират производителността на моделите за среди с ограничени изчислителни ресурси и памет.
- Внедряват и наблюдават AI приложения в реални сценарии за крайни устройства.
Формат на курса
- Интерактивна лекция и демонстрация.
- Практическа лабораторна работа с модели и сценарии, специфични за крайни устройства.
- Примери за внедряване на живо върху виртуален или физически хардуер за крайни устройства.
Опции за персонализиране на курса
- За да заявите персонализирано обучение за този курс, моля, свържете се с нас за уговорка.
Разбиране на AI изчислителния стек на Huawei: От CANN до MindSpore
14 ЧасаAI стекът на Huawei – от нискочестотния SDK CANN до високочестотната рамка MindSpore – предлага тясно интегрирана среда за разработка и внедряване на AI, оптимизирана за хардуера Ascend.
Това обучение с инструктор, на живо (онлайн или на място), е насочено към технически специалисти от начинаещо до средно ниво, които искат да разберат как компонентите CANN и MindSpore работят заедно, за да подпомогнат управлението на жизнения цикъл на AI и решенията за инфраструктура.
До края на обучението участниците ще могат да:
- Разбират слоестата архитектура на AI изчислителния стек на Huawei.
- Идентифицират как CANN поддържа оптимизацията на модели и внедряването на хардуерно ниво.
- Оценяват рамката MindSpore и инструменталната верига в сравнение с алтернативите в индустрията.
- Позиционират AI стека на Huawei в корпоративни или облачни/локални среди.
Формат на курса
- Интерактивна лекция и дискусия.
- Демонстрации на системата на живо и преглед на казуси.
- По избор: насочвани лабораторни упражнения върху потока на модела от MindSpore към CANN.
Опции за персонализиране на курса
- За да заявите персонализирано обучение за този курс, моля, свържете се с нас, за да уговорим.
Оптимизиране на производителността на невронни мрежи с CANN SDK
14 ЧасаCANN SDK (Compute Architecture for Neural Networks) е AI изчислителната основа на Huawei, която позволява на разработчиците да настройват фино и оптимизират производителността на внедрени невронни мрежи върху Ascend AI процесори.
Това обучение с инструктор на живо (онлайн или на място) е насочено към напреднали AI разработчици и системни инженери, които желаят да оптимизират производителността на изводите, използвайки усъвършенствания набор от инструменти на CANN, включително Graph Engine, TIK и разработка на персонализирани оператори.
До края на това обучение участниците ще могат:
- Да разбират архитектурата на изпълнение и жизнения цикъл на производителността на CANN.
- Да използват инструменти за профилиране и Graph Engine за анализ и оптимизация на производителността.
- Да създават и оптимизират персонализирани оператори с помощта на TIK и TVM.
- Да разрешават тесни места в паметта и да подобряват пропускателната способност на моделите.
Формат на курса
- Интерактивна лекция и дискусия.
- Практически лабораторни упражнения с профилиране в реално време и настройка на оператори.
- Упражнения за оптимизация, използващи примери за внедряване в крайни случаи.
Опции за персонализиране на курса
- За да заявите персонализирано обучение за този курс, моля, свържете се с нас за уговорка.
CANN SDK за конвейери в компютърното зрение и НЛП
14 ЧасаCANN SDK (Compute Architecture for Neural Networks) предоставя мощни инструменти за внедряване и оптимизация на AI приложения в реално време в областта на компютърното зрение и НЛП, особено върху хардуера Huawei Ascend.
Това обучение с инструктор на живо (онлайн или на място) е насочено към AI специалисти със средно ниво на опит, които желаят да изграждат, внедряват и оптимизират модели за визуализация и обработка на език, използвайки CANN SDK за производствени сценарии.
До края на това обучение участниците ще могат:
- Да внедряват и оптимизират модели за компютърно зрение и НЛП, използвайки CANN и AscendCL.
- Да използват CANN инструменти за конвертиране на модели и интегрирането им в работещи конвейери.
- Да оптимизират производителността на изводи за задачи като откриване, класификация и анализ на тоналност.
- Да изграждат конвейери за компютърно зрение/НЛП в реално време за сценарии за внедряване в периферията или в облака.
Формат на курса
- Интерактивна лекция и демонстрация.
- Практическа лаборатория с внедряване на модели и профилиране на производителността.
- Проектиране на конвейер на живо, използвайки реални случаи от компютърното зрение и НЛП.
Опции за персонализиране на курса
- За да заявите персонализирано обучение за този курс, моля, свържете се с нас, за да го организираме.
Създаване на персонализирани AI оператори с CANN TIK и TVM
14 ЧасаCANN TIK (Tensor Instruction Kernel) и Apache TVM позволяват усъвършенствана оптимизация и персонализиране на операторите на AI модели за хардуера Huawei Ascend.
Това обучение с инструктор на живо (онлайн или на място) е насочено към системни разработчици на напреднало ниво, които желаят да изграждат, внедряват и настройват персонализирани оператори за AI модели, използвайки програмния модел TIK на CANN и интеграцията с компилатора TVM.
До края на това обучение участниците ще могат да:
- Пишат и тестват персонализирани AI оператори, използвайки TIK DSL за процесори Ascend.
- Интегрират персонализирани оператори в средата за изпълнение и графа на изпълнение на CANN.
- Използват TVM за планиране на оператори, автоматична настройка и сравнителен анализ.
- Отстраняват грешки и оптимизират производителността на ниво инструкции за персонализирани изчислителни модели.
Формат на курса
- Интерактивна лекция и демонстрация.
- Практическо кодиране на оператори с помощта на TIK и TVM потоци.
- Тестване и настройка на хардуер Ascend или симулатори.
Опции за персонализиране на курса
- За да заявите персонализирано обучение за този курс, моля, свържете се с нас, за да уговорим.
Мигриране на CUDA приложения към китайски GPU архитектури
21 ЧасаКитайските GPU архитектури, като Huawei Ascend, Biren и Cambricon MLU, предлагат алтернативи на CUDA, насочени към местните пазари за изкуствен интелект и високопроизводителни изчисления (HPC).
Това обучение, водено от инструктор на живо (онлайн или на място), е предназначено за напреднали GPU програмисти и специалисти по инфраструктура, които желаят да мигрират и оптимизират съществуващи CUDA приложения за внедряване върху китайски хардуерни платформи.
След завършване на обучението участниците ще могат да:
- Оценят съвместимостта на съществуващи CUDA натоварвания с алтернативите на китайски чипове.
- Пренесат кодови бази от CUDA към средите Huawei CANN, Biren SDK и Cambricon BANGPy.
- Сравнят производителността и да идентифицират точки за оптимизация на различните платформи.
- Адресират практически предизвикателства при поддръжката и внедряването между различни архитектури.
Формат на обучението
- Интерактивна лекция и дискусия.
- Практически лабораторни упражнения за превод на код и сравнение на производителността.
- Ръководени упражнения, фокусирани върху стратегии за адаптиране към множество GPU.
Опции за персонализиране на курса
- За да заявите персонализирано обучение за този курс, съобразено с вашата платформа или CUDA проект, моля, свържете се с нас за уговорка.
Оптимизиране на производителността на Ascend, Biren и Cambricon
21 ЧасаAscend, Biren и Cambricon са водещи хардуерни платформи за изкуствен интелект в Китай, всяка от които предлага уникални инструменти за ускорение и профилиране за производствени AI натоварвания.
Това обучение с инструктор на живо (онлайн или присъствено) е насочено към напреднали инженери по AI инфраструктура и производителност, които искат да оптимизират процесите на извод и обучение на модели в множество китайски AI чип платформи.
До края на това обучение участниците ще могат да:
- Провеждат бенчмарк тестове на модели на платформите Ascend, Biren и Cambricon.
- Идентифицират системни тесни места и неефективност на паметта/изчисленията.
- Прилагат оптимизации на ниво граф, ядро и оператор.
- Настройват конвейери за внедряване, за да подобрят пропускателната способност и забавянето.
Формат на курса
- Интерактивна лекция и дискусия.
- Практическо използване на инструменти за профилиране и оптимизация на всяка платформа.
- Насочвани упражнения, фокусирани върху практически сценарии за настройка.
Опции за персонализиране на курса
- За да заявите персонализирано обучение за този курс, съобразено с вашата среда за производителност или тип модел, моля, свържете се с нас за уговаряне.