Курс за обучение по NVIDIA GPU Programming - Extended
Този курс за обучение на живо, ръководен от инструктори, обхваща как да програмирате GPU за паралелни изчисления, как да използвате различни платформи, как да работите с платформата CUDA и нейните функции и как да изпълнявате различни техники за оптимизация с помощта на CUDA. Някои от приложенията включват дълбоко обучение, анализи, обработка на изображения и инженерни приложения.
План на курса
Въведение
Разбиране на основите на хетерогенната изчислителна методология
Защо паралелно изчисление? Разбиране на необходимостта от паралелни изчисления
Многоядрени процесори – архитектура и дизайн
Въведение в нишките, основите на нишките и основните понятия на паралела Programming
Разбиране на основите на GPU процесите за софтуерна оптимизация
OpenMP - стандарт за базиран на директиви паралел Programming
Практика / Демонстрация на различни програми на многоядрени машини
Въведение в GPU Компютинг
GPUs за паралелни изчисления
GPU Programming Модел
Практика / Демонстрация на различни програми на GPU
SDK, набор от инструменти и инсталиране на среда за GPU
Работа с различни библиотеки
Демонстрация на GPU и инструменти с примерни програми и OpenACC
Разбиране на модела CUDA Programming.
Изучаване на CUDA архитектурата
Проучване и настройка на среди за разработка CUDA
Работа с CUDA Runtime API
Разбиране на модела на паметта CUDA
Проучване на допълнителни функции на CUDA API
AccessЕфективно използване на глобална памет в CUDA: Глобална оптимизация на паметта
Оптимизиране на трансфера на данни в CUDA с помощта на CUDA потоци
Използване на споделена памет в CUDA
Разбиране и използване на атомарни операции и инструкции в CUDA
Казус от практиката: Основна цифрова обработка на изображения с CUDA
Работа с Multi-GPU Programming
Разширено хардуерно профилиране и семплиране на NVIDIA / CUDA
Използване на CUDA Dynamic Parallelism API за динамично стартиране на ядрото
Обобщение и заключение
Изисквания
- C Programming
- Linux GCC
Отворените курсове за обучение изискват 5+ участници.
Курс за обучение по NVIDIA GPU Programming - Extended - Booking
Курс за обучение по NVIDIA GPU Programming - Extended - Enquiry
NVIDIA GPU Programming - Extended - Консултантско запитване
Консултантско запитване
Oтзиви от потребители (1)
Обучаващи енергия и хумор.
Tadeusz Kaluba - Nokia Solutions and Networks Sp. z o.o.
Курс - NVIDIA GPU Programming - Extended
Машинен превод
Предстоящи Курсове
Свързани Kурсове
Developing AI Applications with Huawei Ascend and CANN
21 Часа- Настроят и конфигурират средата за разработка на CANN.
- Разработват AI приложения, използвайки MindSpore и CloudMatrix работни процеси.
- Оптимизират производителността на Ascend NPU, използвайки персонализирани оператори и тилинг.
- Разпределят модели в периферни или облачни среди.
- Интерактивна лекция и дискусия.
- Практическо използване на Huawei Ascend и инструменталния комплект CANN в примерни приложения.
- Упътвания за упражнения, фокусирани върху изграждането, обучението и разпределението на модели.
- За да поставите запрос за персонализирано обучение за този курс, базиран на вашата инфраструктура или данни, моля свържете се с нас за уредение.
AI Inference and Deployment with CloudMatrix
21 Часа- Използват КлудMatrix за пакетиране, развертане и предоставяне на модели.
- Конвертират и оптимизират модели за чипсетове Ascend.
- Настрояват пиплайни за задачи с инференс в реално време и в пакети.
- Мониторират развертане и настройват производителност в производствени условия.
- Интерактивни лекции и дискусии.
- Практическо използване на КлудMatrix с реални сценарии за развертане.
- Упътващи упражнения, фокусирани върху конвертиране, оптимизация и масштабируемост.
- За да поискате персонализирано обучение за този курс, базирано на вашата AI инфраструктура или облачна среда, моля свържете се с нас, за да организираме.
GPU Programming on Biren AI Accelerators
21 ЧасаCambricon MLU Development with BANGPy and Neuware
21 ЧасаCambricon MLUs (Machine Learning устройства) са специализирани AI чипове, оптимизирани за извличане на заключения и обучение в сценарии на ръб и в центъра на данните.
Този курс, воден от инструктор (онлайн или на място), е предназначен за разработчици на среден ниво, които искат да създават и разпространяват AI модели, използвайки рамката BANGPy и SDK Neuware върху хардуера на Cambricon MLU.
До края на този курс участниците ще могат да:
- Настрояват и конфигурират разработките на BANGPy и Neuware.
- Разработват и оптимизират модели за Cambricon MLUs, базирани на Python и C++.
- Разпространяват модели към устройства на ръб и в центъра на данните, работещи с Neuware runtime.
- Интегрират ML процеси с ускоряващи функции специфични за MLU.
Формат на курса
- Интерактивни лекции и дискусии.
- Практическо използване на BANGPy и Neuware за разработка и разпространение.
- Проводени упражнения, насочени към оптимизация, интеграция и тестване.
Опции за персонализация на курса
- За да попитате за персонализиран обучение за този курс, базиран на вашия модел на устройство или сценарий на използване на Cambricon, моля, свържете се с нас, за да договорим.
Administration of CUDA
35 ЧасаТова водено от инструктор обучение на живо в България (онлайн или на място) е насочено към системни администратори на ниво начинаещи и ИТ специалисти, които желаят да инсталират, конфигурират, управляват и отстраняват проблеми в CUDA среди.
До края на това обучение участниците ще могат:
- Разберете архитектурата, компонентите и възможностите на CUDA.
- Инсталирайте и конфигурирайте CUDA среди.
- Управлявайте и оптимизирайте ресурсите на CUDA.
- Отстраняване на грешки и отстраняване на често срещани проблеми с CUDA.
GPU Programming with CUDA and Python
14 ЧасаТова инструкторско руководимо живо обучение в България (онлайн или наместно) е насочено към среднокоlescени разработчици, които искат да използват CUDA за построяване на Python приложения, работещи паралелно върху NVIDIA GPU.
До края на това обучение участниците ще могат:
- Да използват компилатора Numba за ускоряване на Python приложения, работещи на NVIDIA GPU.
- Да създават, компилират и стартират персонализирани CUDA ядра.
- Да управляват паметта на GPU.
- Да конвертират CPU-базирано приложение в приложение, ускорено от GPU.
Migrating CUDA Applications to Chinese GPU Architectures
21 ЧасаКитайски GPU архитектури като Huawei Ascend, Biren и Cambricon MLU предлагат алтернативи на CUDA, насочени към местните пазари на изкуствен интелект и HPC.
Този обучение с инструктор (онлайн или на място) е насочено към напреднали GPU програмисти и специалисти по инфраструктура, които искат да мигрират и оптимизират съществуващи CUDA приложения за разгръзване на китайски хардуерни платформи.
Към края на това обучение участниците ще бъдат способни да:
- Оценяват съвместимостта на съществуващите CUDA натоварвания с китайски алтернативи на чиповете.
- Преместят CUDA бази на кодове в средите Huawei CANN, Biren SDK и Cambricon BANGPy.
- Сравняват производителността и идентифицират точки за оптимизация между платформите.
- Решават практичните проблеми при поддръжката и разгръзването на многоархитектурни решения.
Формат на курса
- Интерактивни лекции и дискусии.
- Практическа работа по превод на код и сравнение на производителността.
- Упътващи упражнения, фокусирани върху стратегии за адаптация на много-GPU решения.
Опции за персонализация на курса
- За запитане на персонализиран обучаващ курс за този курс, основан на вашата платформа или проект с CUDA, моля свържете се с нас за уреждане.
GPU Programming with CUDA
28 ЧасаТова водено от инструктор обучение на живо в България (онлайн или на място) е насочено към разработчици от начинаещи до средно ниво, които желаят да използват CUDA за програмиране на NVIDIA GPU и да използват техния паралелизъм.
До края на това обучение участниците ще могат:
- Настройте среда за разработка, която включва CUDA Toolkit, код на NVIDIA GPU и Visual Studio.
- Създайте основна CUDA програма, която извършва добавяне на вектор върху GPU и извлича резултатите от паметта GPU.
- Използвайте CUDA API, за да правите заявки за информация за устройството, да разпределяте и освобождавате памет на устройството, да копирате данни между хост и устройство, да стартирате ядра и да синхронизирате нишки.
- Използвайте езика CUDA C/C++, за да напишете ядра, които се изпълняват на GPU и да манипулират данни.
- Използвайте вградени функции, променливи и библиотеки на CUDA за изпълнение на общи задачи и операции.
- Използвайте CUDA пространства на паметта, като глобални, споделени, постоянни и локални, за да оптимизирате трансфера на данни и достъпа до паметта.
- Използвайте модел за изпълнение на CUDA, за да контролирате нишките, блоковете и решетките, които определят паралелизма.
- Отстранявайте грешки и тествайте CUDA програми с помощта на инструменти като CUDA-GDB, CUDA-MEMCHECK и NVIDIA Nsight.
- Оптимизирайте програмите CUDA, като използвате техники като обединяване, кеширане, предварително извличане и профилиране.
97% удовлетвореност на клиентите.
GPU Programming with OpenCL
28 ЧасаТова водено от инструктор обучение на живо в България (онлайн или на място) е насочено към разработчици от начинаещи до средно ниво, които желаят да използват OpenCL за програмиране на хетерогенни устройства и да използват техния паралелизъм.
До края на това обучение участниците ще могат:
- Настройте среда за разработка, която включва OpenCL SDK, устройство, което поддържа OpenCL и Visual Studio код.
- Създайте основна OpenCL програма, която извършва векторно добавяне на устройството и извлича резултатите от паметта на устройството.
- Използвайте OpenCL API за запитване към информация за устройството, създаване на контексти, опашки с команди, буфери, ядра и събития.
- Използвайте OpenCL език C, за да напишете ядра, които се изпълняват на устройството и манипулират данни.
- Използвайте OpenCL вградени функции, разширения и библиотеки за изпълнение на общи задачи и операции.
- Използвайте OpenCL модели памет на хост и устройство, за да оптимизирате трансфера на данни и достъпа до паметта.
- Използвайте OpenCL модел за изпълнение, за да контролирате работните елементи, работните групи и ND-обхватите.
- Отстранявайте грешки и тествайте OpenCL програми с помощта на инструменти като CodeXL, Intel VTune и NVIDIA Nsight.
- Оптимизирайте OpenCL програми, като използвате техники като векторизация, разгръщане на цикъл, локална памет и профилиране.
GPU Programming - OpenCL vs CUDA vs ROCm
28 ЧасаТова водено от инструктор обучение на живо в България (онлайн или на място) е насочено към разработчици от начинаещи до средно ниво, които желаят да използват различни рамки за GPU програмиране и да сравняват техните характеристики, производителност и съвместимост.
До края на това обучение участниците ще могат:
- Настройте среда за разработка, която включва OpenCL SDK, CUDA Toolkit, ROCm платформа, устройство, което поддържа OpenCL, CUDA или ROCm и Visual Studio код.
- Създайте основна GPU програма, която извършва добавяне на вектори, използвайки OpenCL, CUDA и ROCm, и сравнете синтаксиса, структурата и изпълнението на всяка рамка.
- Използвайте съответните API, за да правите заявки за информация за устройството, да разпределяте и освобождавате памет на устройството, да копирате данни между хост и устройство, да стартирате ядра и да синхронизирате нишки.
- Използвайте съответните езици, за да напишете ядра, които се изпълняват на устройството и манипулират данни.
- Използвайте съответните вградени функции, променливи и библиотеки за изпълнение на общи задачи и операции.
- Използвайте съответните пространства на паметта, като глобална, локална, постоянна и частна, за да оптимизирате прехвърлянето на данни и достъпа до паметта.
- Използвайте съответните модели за изпълнение, за да контролирате нишките, блоковете и решетките, които определят паралелизма.
- Отстранявайте грешки и тествайте GPU програми с помощта на инструменти като CodeXL, CUDA-GDB, CUDA-MEMCHECK и NVIDIA Nsight.
- Оптимизирайте GPU програми, като използвате техники като обединяване, кеширане, предварително извличане и профилиране.
Performance Optimization on Ascend, Biren, and Cambricon
21 ЧасаAscend, Biren и Cambricon са водят AI хардуерни платформи в Китай, всеки от които предлага уникални ускоряващи и профилиращи инструменти за AI задачи на производствен мащаб.
Това обучение с преподавател (онлайн или на място) е направено за напреднали AI инфраструктурни и производителностни инженери, които желаят да оптимизират работите за извличане на предсказания и обучение на модели по различни китайски AI чип платформи.
До края на това обучение участващите ще могат да:
- Бенчмаркват модели на платформите Ascend, Biren и Cambricon.
- Идентифицират системни бутилки и неикономичност на паметта и изчисленията.
- Прилагат оптимизации на ниво граф, ядро и оператор.
- Настройват каналите за развертяване, за да подобрят пропускателната способност и закъснението.
Формат на курса
- Интерактивна лекция и дискусия.
- Практически използване на профилиращи и оптимизиращи инструменти на всяка платформа.
- Упътващи упражнения със фокус върху практическо настройване.
Опции за персонализация на курса
- За заявка за персонализирано обучение по този курс, в зависимост от вашата среда за производителност или тип модели, моля свържете се с нас за уреждане.