Migrating CUDA Applications to Chinese GPU Architectures Training Course
Китайски GPU архитектури като Huawei Ascend, Biren и Cambricon MLU предлагат алтернативи на CUDA, насочени към местните пазари на изкуствен интелект и HPC.
Този обучение с инструктор (онлайн или на място) е насочено към напреднали GPU програмисти и специалисти по инфраструктура, които искат да мигрират и оптимизират съществуващи CUDA приложения за разгръзване на китайски хардуерни платформи.
Към края на това обучение участниците ще бъдат способни да:
- Оценяват съвместимостта на съществуващите CUDA натоварвания с китайски алтернативи на чиповете.
- Преместят CUDA бази на кодове в средите Huawei CANN, Biren SDK и Cambricon BANGPy.
- Сравняват производителността и идентифицират точки за оптимизация между платформите.
- Решават практичните проблеми при поддръжката и разгръзването на многоархитектурни решения.
Формат на курса
- Интерактивни лекции и дискусии.
- Практическа работа по превод на код и сравнение на производителността.
- Упътващи упражнения, фокусирани върху стратегии за адаптация на много-GPU решения.
Опции за персонализация на курса
- За запитане на персонализиран обучаващ курс за този курс, основан на вашата платформа или проект с CUDA, моля свържете се с нас за уреждане.
План на курса
Преглед на китайската AI GPU екосистема
- Сравнение на Huawei Ascend, Biren, Cambricon MLU
- CUDA vs CANN, Biren SDK, и BANGPy модели
- Трендове в индустрията и екосистеми на доставчици
Подготовка за миграция
- Оценка на вашата CUDA кодова база
- Идентифициране на целеви платформи и версии на SDK
- Инсталация на инструментална верига и настройка на среда
Техники за превод на код
- Прехвърляне на CUDA достъп до памет и логика на ядро
- Картиране на модели за изчисления мрежа/поток
- Автоматичен срещу ръчен превод
Реализации специфични за платформа
- Използване на оператори на Huawei CANN и потребителски ядра
- Конверционен пиплайни на Biren SDK
- Повторно изграждане на модели с BANGPy (Cambricon)
Тестиране и оптимизация на крос-платформено ниво
- Профилиране на изпълнение на всяка целева платформа
- Настройка на паметта и сравнение на паралелно изпълнение
- Следване на производителност и итерации
Управление на смесени GPU среди
- Хибридни развертания с много архитектури
- Стратегии за възстановяване и откриване на устройства
- Абстракционни слоеве за поддръжка на код
Случаи за използване и добри практики
- Прехвърляне на модели за визуализация/NLP към Ascend или Cambricon
- Модернизация на пиплайните за извод в кластери Biren
- Работа с несоответствия в версиите и пролуки в API
Резюме и следващи стъпки
Изисквания
- Имате опит в програмиране с CUDA или приложения, базирани на GPU
- Разбирате се в паметните модели и изчислителните ядра на GPU
- Свързаност с процесите за развертане или ускоряване на AI модели
Целева аудитория
- Програмисти на GPU
- Системни архитекти
- Специалисти по преобразуване
Отворените курсове за обучение изискват 5+ участници.
Migrating CUDA Applications to Chinese GPU Architectures Training Course - Booking
Migrating CUDA Applications to Chinese GPU Architectures Training Course - Enquiry
Migrating CUDA Applications to Chinese GPU Architectures - Консултантско запитване
Консултантско запитване
Предстоящи Курсове
Свързани Kурсове
Developing AI Applications with Huawei Ascend and CANN
21 Часа- Настроят и конфигурират средата за разработка на CANN.
- Разработват AI приложения, използвайки MindSpore и CloudMatrix работни процеси.
- Оптимизират производителността на Ascend NPU, използвайки персонализирани оператори и тилинг.
- Разпределят модели в периферни или облачни среди.
- Интерактивна лекция и дискусия.
- Практическо използване на Huawei Ascend и инструменталния комплект CANN в примерни приложения.
- Упътвания за упражнения, фокусирани върху изграждането, обучението и разпределението на модели.
- За да поставите запрос за персонализирано обучение за този курс, базиран на вашата инфраструктура или данни, моля свържете се с нас за уредение.
Deploying AI Models with CANN and Ascend AI Processors
14 ЧасаCANN (Compute Architecture for Neural Networks) is Huawei’s AI compute stack for deploying and optimizing AI models on Ascend AI processors.
This instructor-led, live training (online or onsite) is aimed at intermediate-level AI developers and engineers who wish to deploy trained AI models efficiently to Huawei Ascend hardware using the CANN toolkit and tools such as MindSpore, TensorFlow, or PyTorch.
By the end of this training, participants will be able to:
- Understand the CANN architecture and its role in the AI deployment pipeline.
- Convert and adapt models from popular frameworks to Ascend-compatible formats.
- Use tools like ATC, OM model conversion, and MindSpore for edge and cloud inference.
- Diagnose deployment issues and optimize performance on Ascend hardware.
Format of the Course
- Interactive lecture and demonstration.
- Hands-on lab work using CANN tools and Ascend simulators or devices.
- Practical deployment scenarios based on real-world AI models.
Course Customization Options
- To request a customized training for this course, please contact us to arrange.
AI Inference and Deployment with CloudMatrix
21 Часа- Използват КлудMatrix за пакетиране, развертане и предоставяне на модели.
- Конвертират и оптимизират модели за чипсетове Ascend.
- Настрояват пиплайни за задачи с инференс в реално време и в пакети.
- Мониторират развертане и настройват производителност в производствени условия.
- Интерактивни лекции и дискусии.
- Практическо използване на КлудMatrix с реални сценарии за развертане.
- Упътващи упражнения, фокусирани върху конвертиране, оптимизация и масштабируемост.
- За да поискате персонализирано обучение за този курс, базирано на вашата AI инфраструктура или облачна среда, моля свържете се с нас, за да организираме.
GPU Programming on Biren AI Accelerators
21 ЧасаCambricon MLU Development with BANGPy and Neuware
21 ЧасаCambricon MLUs (Machine Learning устройства) са специализирани AI чипове, оптимизирани за извличане на заключения и обучение в сценарии на ръб и в центъра на данните.
Този курс, воден от инструктор (онлайн или на място), е предназначен за разработчици на среден ниво, които искат да създават и разпространяват AI модели, използвайки рамката BANGPy и SDK Neuware върху хардуера на Cambricon MLU.
До края на този курс участниците ще могат да:
- Настрояват и конфигурират разработките на BANGPy и Neuware.
- Разработват и оптимизират модели за Cambricon MLUs, базирани на Python и C++.
- Разпространяват модели към устройства на ръб и в центъра на данните, работещи с Neuware runtime.
- Интегрират ML процеси с ускоряващи функции специфични за MLU.
Формат на курса
- Интерактивни лекции и дискусии.
- Практическо използване на BANGPy и Neuware за разработка и разпространение.
- Проводени упражнения, насочени към оптимизация, интеграция и тестване.
Опции за персонализация на курса
- За да попитате за персонализиран обучение за този курс, базиран на вашия модел на устройство или сценарий на използване на Cambricon, моля, свържете се с нас, за да договорим.
Introduction to CANN for AI Framework Developers
7 ЧасаCANN (Compute Architecture for Neural Networks) is Huawei’s AI computing toolkit used to compile, optimize, and deploy AI models on Ascend AI processors.
This instructor-led, live training (online or onsite) is aimed at beginner-level AI developers who wish to understand how CANN fits into the model lifecycle from training to deployment, and how it works with frameworks like MindSpore, TensorFlow, and PyTorch.
By the end of this training, participants will be able to:
- Understand the purpose and architecture of the CANN toolkit.
- Set up a development environment with CANN and MindSpore.
- Convert and deploy a simple AI model to Ascend hardware.
- Gain foundational knowledge for future CANN optimization or integration projects.
Format of the Course
- Interactive lecture and discussion.
- Hands-on labs with simple model deployment.
- Step-by-step walkthrough of the CANN toolchain and integration points.
Course Customization Options
- To request a customized training for this course, please contact us to arrange.
CANN for Edge AI Deployment
14 ЧасаHuawei's Ascend CANN toolkit enables powerful AI inference on edge devices such as the Ascend 310. CANN provides essential tools for compiling, optimizing, and deploying models where compute and memory are constrained.
This instructor-led, live training (online or onsite) is aimed at intermediate-level AI developers and integrators who wish to deploy and optimize models on Ascend edge devices using the CANN toolchain.
By the end of this training, participants will be able to:
- Prepare and convert AI models for Ascend 310 using CANN tools.
- Build lightweight inference pipelines using MindSpore Lite and AscendCL.
- Optimize model performance for limited compute and memory environments.
- Deploy and monitor AI applications in real-world edge use cases.
Format of the Course
- Interactive lecture and demonstration.
- Hands-on lab work with edge-specific models and scenarios.
- Live deployment examples on virtual or physical edge hardware.
Course Customization Options
- To request a customized training for this course, please contact us to arrange.
Understanding Huawei’s AI Compute Stack: From CANN to MindSpore
14 ЧасаHuawei’s AI stack — from the low-level CANN SDK to the high-level MindSpore framework — offers a tightly integrated AI development and deployment environment optimized for Ascend hardware.
This instructor-led, live training (online or onsite) is aimed at beginner-level to intermediate-level technical professionals who wish to understand how the CANN and MindSpore components work together to support AI lifecycle management and infrastructure decisions.
By the end of this training, participants will be able to:
- Understand the layered architecture of Huawei’s AI compute stack.
- Identify how CANN supports model optimization and hardware-level deployment.
- Evaluate the MindSpore framework and toolchain in relation to industry alternatives.
- Position Huawei's AI stack within enterprise or cloud/on-prem environments.
Format of the Course
- Interactive lecture and discussion.
- Live system demos and case-based walkthroughs.
- Optional guided labs on model flow from MindSpore to CANN.
Course Customization Options
- To request a customized training for this course, please contact us to arrange.
Optimizing Neural Network Performance with CANN SDK
14 ЧасаCANN SDK (Compute Architecture for Neural Networks) is Huawei’s AI compute foundation that allows developers to fine-tune and optimize the performance of deployed neural networks on Ascend AI processors.
This instructor-led, live training (online or onsite) is aimed at advanced-level AI developers and system engineers who wish to optimize inference performance using CANN’s advanced toolset, including the Graph Engine, TIK, and custom operator development.
By the end of this training, participants will be able to:
- Understand CANN's runtime architecture and performance lifecycle.
- Use profiling tools and Graph Engine for performance analysis and optimization.
- Create and optimize custom operators using TIK and TVM.
- Resolve memory bottlenecks and improve model throughput.
Format of the Course
- Interactive lecture and discussion.
- Hands-on labs with real-time profiling and operator tuning.
- Optimization exercises using edge-case deployment examples.
Course Customization Options
- To request a customized training for this course, please contact us to arrange.
CANN SDK for Computer Vision and NLP Pipelines
14 ЧасаThe CANN SDK (Compute Architecture for Neural Networks) provides powerful deployment and optimization tools for real-time AI applications in computer vision and NLP, especially on Huawei Ascend hardware.
This instructor-led, live training (online or onsite) is aimed at intermediate-level AI practitioners who wish to build, deploy, and optimize vision and language models using the CANN SDK for production use cases.
By the end of this training, participants will be able to:
- Deploy and optimize CV and NLP models using CANN and AscendCL.
- Use CANN tools to convert models and integrate them into live pipelines.
- Optimize inference performance for tasks like detection, classification, and sentiment analysis.
- Build real-time CV/NLP pipelines for edge or cloud-based deployment scenarios.
Format of the Course
- Interactive lecture and demonstration.
- Hands-on lab with model deployment and performance profiling.
- Live pipeline design using real CV and NLP use cases.
Course Customization Options
- To request a customized training for this course, please contact us to arrange.
Building Custom AI Operators with CANN TIK and TVM
14 ЧасаCANN TIK (Tensor Instruction Kernel) and Apache TVM enable advanced optimization and customization of AI model operators for Huawei Ascend hardware.
This instructor-led, live training (online or onsite) is aimed at advanced-level system developers who wish to build, deploy, and tune custom operators for AI models using CANN’s TIK programming model and TVM compiler integration.
By the end of this training, participants will be able to:
- Write and test custom AI operators using the TIK DSL for Ascend processors.
- Integrate custom ops into the CANN runtime and execution graph.
- Use TVM for operator scheduling, auto-tuning, and benchmarking.
- Debug and optimize instruction-level performance for custom computation patterns.
Format of the Course
- Interactive lecture and demonstration.
- Hands-on coding of operators using TIK and TVM pipelines.
- Testing and tuning on Ascend hardware or simulators.
Course Customization Options
- To request a customized training for this course, please contact us to arrange.
Performance Optimization on Ascend, Biren, and Cambricon
21 ЧасаAscend, Biren и Cambricon са водят AI хардуерни платформи в Китай, всеки от които предлага уникални ускоряващи и профилиращи инструменти за AI задачи на производствен мащаб.
Това обучение с преподавател (онлайн или на място) е направено за напреднали AI инфраструктурни и производителностни инженери, които желаят да оптимизират работите за извличане на предсказания и обучение на модели по различни китайски AI чип платформи.
До края на това обучение участващите ще могат да:
- Бенчмаркват модели на платформите Ascend, Biren и Cambricon.
- Идентифицират системни бутилки и неикономичност на паметта и изчисленията.
- Прилагат оптимизации на ниво граф, ядро и оператор.
- Настройват каналите за развертяване, за да подобрят пропускателната способност и закъснението.
Формат на курса
- Интерактивна лекция и дискусия.
- Практически използване на профилиращи и оптимизиращи инструменти на всяка платформа.
- Упътващи упражнения със фокус върху практическо настройване.
Опции за персонализация на курса
- За заявка за персонализирано обучение по този курс, в зависимост от вашата среда за производителност или тип модели, моля свържете се с нас за уреждане.